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重点 突出 : 全 面 系统 地 介绍 多 媒体 计算 机 原理 与 技术 应 用 
重视 实践 : 和 典型 实例 + 操作 素 例 + 综合 实验 符合 实践 性 规律 
最 新 应 用 : 增加 了 3G 多 媒体 通信 技术 和 流 媒体 技术 等 内 容 
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容 简介 

多 媒体 技术 是 集 文字 、 图 形 、 图 像 、 动 画 、 音 频 、 视 频 于 一 体 的 信息 处 理 技术 。 它 综合 了 当代 计算 机 硬 
件 和 软件 的 最 新 成 果 ， 是 计算 机 技术 的 重要 发 展 方向 。 本 书 较 系 统 地 介绍 了 多 媒体 计算 机 的 基本 原理 、 处 理 
技术 和 具体 应 用 。 

全 书 共 10 章 ， 分 别 介绍 了 多 媒体 技术 的 基本 概念 、 音 频 信号 处 理 技术 、 数 字 图 像 与 视频 处 理 技术 、 多 
媒体 数据 压缩 技术 、 计 算 机 动画 技术 、 多 媒体 信息 的 组 织 与 管理 、 多 媒体 数据 存储 技术 、 虚 拟 现实 技术 、 多 
媒体 通信 技术 和 多 媒体 技术 实验 。 本 书 对 多 媒体 技术 的 主要 研究 内 容 、 开 发 设计 方法 和 应 用 实例 做 了 系统 的 
益 述 ， 并 配 有 教案 演示 文稿 、 实 验 指导 和 相应 的 实验 素材 。 

在 本 书 的 编写 过 程 中 ， 力 求 做 到 深入 浅 出 ， 可 读 易 懂 。 在 内 容 的 选取 上 ， 遵 循 多 媒体 计算 机 技术 原理 与 
多 媒体 技术 应 用 相 结合 的 原则 ， 全 面 系统 地 介绍 多 媒体 计算 机 原理 与 5 多 媒体 技术 应 用 : 既 注 重 理论 、 方 法 和 
标准 的 介绍 ， 又 兼顾 实际 系统 分 析 、 具 体 技术 讨论 和 实际 应 用 举例 。 

本 书 可 作为 “多 媒体 技术 原理 与 应 用 ”或 “多 媒体 应 用 技术 ” woe 也 可 作为 科学 技术 
人 员 、 计算 机 爱好 者 以 及 从 事 计算 机 行业 的 工程 技术 人 员 的 参考 用 CS N\ 
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第 1 版 前 言 


多 媒体 技术 是 计算 机 技术 的 重要 发 展 方向 ， 它 综合 了 文字 、 图 形 、 图 像 、 音 频 等 多 种 媒 
体 ， 不 仅 是 计算 机 处 理 系统 的 扩充 ， 而 且 改变 了 传统 的 传播 和 处 理 方式 。 近 年 来 多 媒体 技术 
的 迅速 发 展 ， 使 得 计算 机 、 电 视 、 通 信 等 信息 产业 不 断 聚 合 ， 从 而 释放 出 更 大 的 能 量 ， 加 束 
信息 系统 的 建设 和 普及 ， 使 我 们 社会 更 快 地 向 信息 化 方向 过 渡 。 

多 媒体 技术 作为 一 种 信息 处 理 技术 ， 其 应 用 领域 已 渗透 到 教育 、 交 通 、 旅 游 、 出 版 、 医 
疗 和 水 利 等 社会 的 不 同 领域 。 因 为 它 具 有 很 强 的 实用 性 和 交互 式 综合 处 理 多 种 信息 的 能 力 
越 来 越 多 的 人 迫切 需要 了 解 、 掌 握 多 媒体 原理 与 实用 技术 ,许多 高 校 相继 开设 了 多 媒体 技术 
方面 的 课程 ， 社 会 上 各 类 继续 教育 机 构 也 纷纷 开展 了 多 媒体 技术 的 培训 ， 以 满足 实际 的 应 用 
Mb tt 
还 从 少 ， 地 和 于 柏 写 汪汪 示 面 术 的 宪 休 村 术 广 而 各 和 

本 书 是 为 计算 机 专业 的 学 生 以 及 从 事 计算 机 科学 与 技术 贡 作 的 工程 技术 人 员 而 编写 的 
也 适合 非 计算 机 专业 的 学 生 使 用 。 本 书 从 基本 原理 、 实 用 技术 和 具体 应 用 3 方面 加 以 介绍 。 

ee 。 在 内 容 的 选取 上 ， 遵 循 多 媒体 计 
算 机 技术 原理 与 多 媒体 技术 应 用 相 结 合 的 原则 ,全面 系统 地 介绍 多 媒体 计算 机 原理 与 多 媒体 
技术 应 用 ， 吧 注重 理论 、 方 法 和 标准 的 介绍 下 又 兼顾 实际 系统 分 析 、 具 体 技术 讨论 和 实际 应 
举例 。 SS 
全 书 共 11 章 ， 分 别 介绍 了 多 媒体 技术 的 基本 概念 、 理 频 信号 处 理 技术 、 数 字 图 像 与 视 
频 处 理 技术 、 数 据 压 缩 技术 、 计 算 机 动画 技术 、 多 媒体 数据 库 、 多 媒体 创作 系统 、 多 媒体 硬 
件 ， 人 机 异 面 、 频 损 实 撞 放 氏 休 通信 等 

考虑 到 读者 的 广泛 性 7 在 音节 安排 上 ， 本 书 尽量 获 到 各 章 独立 , 为 了 便于 教师 组 织 教学 
本 书 配 有 图 文 并 茂 的 教学 幻灯 片 (包括 全 书 将 内 省 )， 并 生生 的 本 有 用 学 所 < 和 用 
人 择 两 种 教案 中 的 一 种 ，GD36 学 时 教案 ， 第 1 一 























































































































第 3 章 、 第 5 章 及 第 8 章 ， 若 有 条 件 可 加 16 学 时 让 学 生 上 机 练习 ，@)48 学 时 教案 : 
第 1 一 第 3 章 、' 第 5 一 第 7 章 及 第 8 章 ， 并 根据 需要 ， 加 选 第 4 章 、 第 9 章 、 第 10 章 和 第 11 
章 ， 若 有 条 件 ， 可 加 16 一 24 学 时 让 学 生 上 机 练习 。 为 帮助 读者 巩固 所 学 知识 ， 本 书 每 章 均 
配 有 习题 。 
本 书 是 多 个 学 校 、 多 位 老师 共同 努力 的 成 果 ， 参 与 编写 的 老师 一 共有 七 位 : 张 正 兰 、 
目 喜 、 张 明 、 纪 鹏 、 张 震 、 郑 爱 彬 、 刘 才 。 具 体 分 工 为 : 第 1 章 、 第 2 章 、 第 3 章 由 上 
海事 大 学 张 正 兰 老师 编写 ; 第 4 章 、 第 6 章 由 平顶山 学 院 鲁 书 喜 老师 编写 ; 第 5 章 、 第 8 
上 海 海事 大 学 张 明 老 师 编写 ; 第 7 章 由 黄石 理工 学 院 纪 鹏 老师 编写 : 第 9 章 由 淮北 煤炭 
范 学 院 张震 老师 编写 ; 第 10 章 由 南京 师范 大 学 郑 爱 彬 老师 编写 ; 第 11 章 由 南京 审计 学 院 
毅 老 师 编写 。 其 中 张 正 兰 老师 全 面 负责 了 本 书 大 纲 的 拟定 、 编 写 任务 的 安排 与 分 配 以 及 全 
的 统 稿 等 相关 工作 。 重 书 喜 、 张 明 、 纪 鹏 三 位 老师 也 对 本 书 的 编写 提出 了 很 多 有 益 的 建议 。 
本 书 在 编写 过 程 中 ， 参 考 和 引用 了 许多 国内 外 文献 资料 ， 在 此 向 这 些 文献 资料 的 作者 、 
编者 、 译 者 表示 衷心 的 感谢 。 
限于 作者 水 平 ， 加 之 时 间 仓促 ， 书 中 难免 有 许多 不 妥 之 处 ， 敬 请 读者 批评 指正 。 
编 者 
2005 年 12 月 
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第 2 版 前 言 


多 媒体 技术 是 计算 机 技术 的 重要 发 展 方向 ， 它 综合 了 文字 、 图 形 、 图 像 、 音 频 、 视 频 等 


多 种 媒体 





， 不 仅 是 计算 机 处 理 系统 的 扩充 ， 而 且 改变 了 传统 的 传播 和 处 理 方式 。 近 年 来 多 媒 





体 技术 的 迅速 发 展 ， 使 得 计算 机 、 电 视 、 通 信 等 信息 产业 不 断 聚 合 ， 从 而 释放 出 更 大 的 能 量 
加 速 信息 系统 的 建设 和 普及 ， 使 社会 更 快 地 向 信息 化 方向 过 渡 。 
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考虑 
本 书 配 有 


多 媒体 技术 作为 一 种 信息 处 理 技术 ， 其 应 用 领域 已 渗透 到 教育 、 交 通 、 旅 游 、 出 版 、 医 
4 人 迫切 需要 了 解 、 掌 握 多 媒体 原理 与 实用 技术 ， 许 多 高 校 相继 开设 了 多 媒体 技术 方面 的 


需求 。 虽 然 目前 市 场 上 有 一 些 多 媒体 方面 的 书籍 ， 但 适合 作为 
大 量 习 题 和 实验 内 容 及 实验 素材 的 书籍 还 偏 少 ， 过 切 需要 、 林 适应 面 较 广 的 多 媒体 技术 方 




















的 不 同 领域 。 因 为 它 具 有 很 强 的 实用 性 和 交互 式 综合 处 理 多 种 信息 的 能 力 ， 越 来 越 









































det tn he 和 普及 
教材 的 、 带 有 电子 教案 、 配 








是 为 计算 机 专业 的 学 生 以 及 从 事 计算 机 科学 与 技术 作 的 工程 技术 人 员 而 编写 的 














也 适合 非 计算 机 专业 的 学 生 使 用 。 本 书 从 基本 原理 实用 技术 和 具体 应 用 3 方面 加 以 介绍 。 


原理 与 多 媒体 技术 应 用 相 结合 的 原则 ， 全 面 系统 地 介绍 多 媒体 计算 机 原理 与 多 媒体 
1 星 重 理 论 、 方 法 和 本 闪 细 ， 又 亲本 人 折 、 只 体 技术 讨论 和 实 了 应 


人 a 
全 书 共 10 章 ， 包 括 体 技术 概述 、 音 频 信号 处 理 技 术 、 数 字 图 像 与 视频 处 理 技术 、 多 


压缩 技术 > 多 媒体 计算 机 动画 技术 多 媒体 信息 的 组 织 与 管理 、 多 媒体 数据 存储 技 
现实 技术 、 多 媒体 通信 以 及 多 媒体 技术 实验 。 

到 读者 的 广泛 性 ， 本 书 在 章节 安排 上 尽量 做 到 各 章 独立 。 为 了 便于 教师 组 织 教 学 

图 文 并 茂 的 教学 幻灯 片 ， 每 章 均 配 有 教学 提示 和 教学 目标 ， 在 教学 安排 时 ， 根 据 学 


时 要 求 ， 可 选择 两 种 教案 中 的 一 种 : GD36 学 时 教案 ,第 1~3 章 、 第 5 一 7 章 及 第 10 章 ， 可 
加 16 学 时 让 学 生 上 机 练习 ; @48 学 时 教案 , 第 1~3 章 、 第 4 一 7 章 及 第 10 章 ， 并 根据 需要 ， 


加 选 第 8 
每 章 均 配 


的 实验 素材 ， 学 生 可 从 www.pup6.com 上 直接 下 载 。 


本 书 
有 张 正 兰 
需要 ， 第 
人 机 界面 
的 内 容 进 
章 一 一 多 
媒体 技术 
版 中 的 第 
媒体 技术 

















章 、 第 9 章 ， 建 议 加 16 一 24 学 时 让 学 生 上 机 练习 。 为 帮助 读者 巩固 所 学 知识 ， 本 书 
有 习题 。 为 了 加 强 学 生 的 实际 动手 能 力 ， 本 书 安排 了 详细 的 实验 内 容 ， 并 提供 相应 





是 在 张 正 兰 主编 的 《多 媒体 技术 及 其 应 用 》 基 础 上 改版 的 。 第 1 版 参与 编写 的 人 员 
、 张 明 、 鲁 书 喜 、 纪 鹏 、 张 震 、 郑 爱 彬 、 刘 毅 。 考 虑 到 多 媒体 技术 的 发 展 和 教学 的 
2 版 进行 了 大 幅度 修改 。 删 掉 了 第 1 版 中 的 第 7 章 一 一 多 媒体 创作 系统 和 第 9 章 一 一 
; 将 第 1 版 的 第 6 章 一 一 多 媒体 数据 库 技术 改 为 多 媒体 信息 的 组 织 与 管理 ， 对 原 有 
行 了 修改 , 增加 了 XML 等 新 技术 内 容 ， 将 第 1 版 的 第 8 章 一 一 多 媒体 硬件 改 为 第 7 
媒体 数据 存储 技术 , 介绍 了 当前 流行 的 各 种 存储 技术 及 应 用 ; 增加 了 第 10 章 一 一 多 
实验 ， 安 排 了 多 媒体 的 实验 内 容 并 配 有 相应 的 实验 素材 ， 以 方便 教学 。 另 外 对 第 1 
1 章 、 第 2 章 、 第 3 章 、 第 5 章 和 第 11 章 分 别 进行 了 修改 。 其 中 ， 第 1 章 增加 了 多 
的 新 进展 与 新 方法 ， 如 移动 多 媒体 技术 、 体 感 游戏 技术 等 ， 第 2 章 对 原 有 内 容 进行 

















A 下 多 并 体 技术 及 其 应 用 (第 版) 

了 取舍 ， 去 掉 了 脉冲 编码 调制 技术 的 相关 内 容 ， 第 3 章 增 加 了 视频 编辑 的 相关 内 容 ， 对 第 4 
章 部 分 内 容 进 行 了 修改 ， 添 加 了 习题 内 容 ， 第 5 章 将 第 1 版 中 介绍 的 动画 制作 软件 改 为 最 新 
版 本 3ds Max 2013 和 Flash Professional CS5; 在 第 1 版 的 第 11 章 多 媒体 通信 部 分 内 容 进 行 了 
修改 , 增加 了 3G 多 媒体 通信 技术 和 流 媒体 技术 等 内 容 。 本 书 第 1 章 、 第 2 章 是 在 上 海 海事 大 
学 张 正 兰 编写 的 基础 上 改编 的 ; 第 3 章 、 第 5 章 由 上 海 海事 大 学 张 明 编写 ; 第 4 章 、 第 6 章 

要 由 平顶山 学 院 鲁 书 喜 编写 ， 张 明 修改 编写 了 部 分 内 容 ; 第 7 章 、 第 10 章 由 上 海 海事 大 学 

王 玉 平 编写 ， 第 8 章 由 南京 师范 大 学 郑 爱 彬 编写 ; 第 9 章 由 南京 审计 学 院 刘 谢 编写 ， 张 明 修 

改编 写 了 部 分 内 容 。 在 本 书 的 改版 之 际 ， 我 们 衷心 感谢 湖北 理工 学 院 纪 脑 副 教授 和 淮北 煤炭 
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第 1 畜 多 媒体 技术 概述 


教学 提示 


> 多 媒体 是 融合 两 种 或 者 两 种 以 上 媒体 的 一 种 人 机 交互 式 信息 交流 和 
传播 媒体 ， 使 用 的 媒体 包括 文字 、 图 形 、 图 像 、 音 频 、 动 画 和 视频 
等 。 多 媒体 是 超 媒体 的 其 中 一 类 。 超 媒体 系统 是 使 用 超 链接 构成 的 
全 球 信息 系统 ,“ 爹 球 信息 系统 是 使 用 TCP/IP 协议 的 应 用 系统 。 

> 多 媒体 技术 是 计算 机 技术 的 重要 发 展 方向 ， 它 综合 集成 多 种 媒体 ， 
不 仅 是 计算 机 处 理 系 统 的 护 充 而 且 改 变 了 传统 的 传播 和 处 理 方式 ， 
创造 了 新 的 人 类 文明 。 

Hf 

> 本 章 将 主要 围绕 媒体 的 基本 形式 和 性 质 ， 介 绍 多 媒体 的 基本 概念 、 
多 媒体 系统 的 组 成 与 体系 结构 、 多 媒体 系统 使 用 的 技术 ， 以 及 多 媒 
体 技术 的 研究 内 容 和 发 展 趋势 。 


下 人 投 术 用 其 应 用 [第 之 入) 
1.1 多 媒体 技术 基本 概念 


自 20 世纪 80 年 代 以 来 , 随 着 电子 技术 和 大 规模 集成 电路 技术 的 发 展 ,计算 机 技术 、 通 信 
技术 和 广播 电视 技术 这 原本 各 自 独立 并 得 到 极 大 发 展 的 领域 相互 渗透 、 融 合 , 进而 形成 了 一 门 
办 新 的 技术 ， 即 多 媒体 技术 。 经 过 多 年 的 探索 、 研 究 与 应 用 ， 人 们 对 多 媒体 技术 的 认识 不 断 加 
深 ， 在 多 媒体 的 概念 、 定 义 、 媒体 类 型 、 多 媒体 技术 与 系统 的 特征 等 方面 逐渐 形成 了 共识 。 


1.1.1 数据、 信息 与 媒体 


如 今 多 媒体 是 人 们 经 常 谈论 的 名 词 之 一 ， 而 要 弄 清 什 么 是 多 媒体 ， 首 先 要 了 解 什么 是 数 
据 、 信 息 和 媒体 。 
日 常生 活 中 所 说 的 “数据 ”主要 是 指 可 比较 大 小 的 一 些 数值 信息 处 理 领 域 中 的 数据 
概念 要 比 这 大 得 多 。 国 际 标准 化 组 织 (International SN tor andardization，ISO) 对 数 
据 所 下 的 定义 是 对 事实 、 概 念 或 指令 的 一 Er yw 






































方式 或 者 用 自动 化 的 装置 进行 通信 、 翻 译 转换 或 者 。 这 里 “特殊 的 表达 形式 ” 指 
4 是 二 进 制 编码 表示 形式 。 SS 

在 计算 机 系统 中 ， 数据 分 为 数值 型 数据 和 菲 孝 信 型 数据 。 数 值 型 数据 是 指 入 们 日 常生 活 
a pe 
来 表示 图 形 图 像 、 动 画 

ein 六 息 是 对 人 有 用 的 数据 ， 这 些 数据 将 可 能 影响 到 人 们 
行为 与 决策 。 和 此 可 见 站 部 从 有 区 别 的 全民 各 存在 的 训 实 ， 概念 或 指令 的 
一 种 可 供 加 工 处 理 的 特殊 妆 达 形式 ， 而 信息 强调 的 则 是 对 人 有 影响 的 数据 。 
ee 机 领域 中 ， 能 够 表示 信息 的 文字 、 图 形 、 
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、 图 像 、 i 以 被 称 为 媒体 。 
根据 国 际 电报 电话 咨询 委员 会 (intemation ll eh and Telephone Consultative Committee, 
CCITT) 的 定义 ， 媒 体 可 分 为 如 下 5 种 类 型 。 


1. 感觉 媒体 

感觉 媒体 (Perception Medium) 是 能 直接 作用 于 人 的 感官 , 使 人 产生 感觉 的 媒体 ， 即 能 使 人 
类 听觉 、 视 觉 、 噢 觉 、 味 觉 和 触觉 器 官 直 接 产生 感觉 的 一 类 媒体 。 感 觉 媒 体 包括 人 类 的 语言 、 
音乐 和 自然 界 的 各 种 声音 、 活 动 图 像 、 静 止 图 像 、 图 形 、 动 画 、 文 本 等 。 它 们 是 人 类 有 效 表 
达 信 息 的 形式 。 

2. 表示 媒体 

表示 媒体 (Representation Medium) 是 为 了 加 工 、 处 理 和 传输 感觉 媒体 而 人 为 地 研究 、 构 造 
出 来 的 一 种 媒体 。 其 基本 目的 是 能 更 有 效 地 将 感觉 媒体 从 一 方向 另 一 方 传送 ， 便 于 加 工 和 处 
理 。 表 示 媒 体 有 各 种 编码 方式 ， 如 语言 编码 、 文 本 编码 、 静 止 和 运动 图 像 编 码 等 ， 即 声 、 文 、 
图 、 活 动 图 像 的 二 进 制 表示 。 

3. 展现 媒体 

展现 媒体 (Presentation Medium) 是 指 把 感觉 媒体 转换 成 表示 媒体 ， 表 示 媒 体 转换 为 感觉 媒 


区 












































| 
体 的 物理 设备 。 展 现 媒体 (又 称 显 示 媒 体 ) 分 两 种 : 输入 显示 媒体 (包括 鼠标 、 键 盘 、 扫 描 仪 、 
摄像 机 、 光 笔 、 传 声 器 等 ) 和 输出 显示 媒体 (包括 显示 器 、 音 箱 和 打印 机 等 )。 
4. 存储 媒体 
存储 媒体 (Storage Medium) 是 用 于 存放 表示 媒体 ( 即 把 感觉 媒体 数字 化 后 的 代码 进行 存 
入 )， 以 便 计算 机 随时 处 理 加 工 和 调用 信息 编码 的 物理 实体 。 存 放 代 码 的 这 类 存储 媒体 有 半 导 
体 存 储 器 、 磁 盘 和 CD-ROM 等 。 














5. 传输 媒体 

传输 媒体 (Transmission Medium) 是 将 媒体 从 一 台 计算 机 转送 到 另 一 台 计 算 机 的 通信 载体 ， 
如 电话 线 、 同 轴 电 缆 、 光 纤 等 。 此 外 ， 还 可 将 用 于 信息 存储 和 信息 传输 的 媒体 称 为 信息 交换 
媒体 。 计 算 机 与 5 种 媒体 的 关系 如 图 1.1 所 示 。 


表示 媒体 丛 





虐 现 媒体 
感觉 媒体 





- 国 11 Hs ma 
根据 时 间 在 表示 包 人 ht 的 作用 可 以 把 媒人 上 
1， 离 散 媒体 < 


ee A 它们 由 独立 于 时 间 的 元 素 项 组 成 ， 
媒体 的 内 容 不 随时 间 的 变化 而 变化 。 当 然 ， 人 们 可 以 按 一 定 的 时 序 来 显示 它们 。 


2. 连续 媒体 

连续 媒体 是 指 与 时 间 相 关 的 、 依 赖 于 时 间 的 媒体 ， 如 声音 、 活 动 图 像 等 都 是 连续 媒体 。 
连续 媒体 的 内 容 是 随 着 时 间 而 变化 的 。 因 此 ,媒体 在 表示 时 要 根据 一 定 的 时 序 信 息 进行 处 理 ， 
即时 间或 时 序 关系 是 信息 的 一 部 分 。 如 果 媒 体 中 项 的 次 序 发 生 了 变化 ， 或 时 序 发 生 了 变化 ， 
那么 媒体 表示 的 含义 、 展 现 的 含义 、 存 储 的 含义 等 也 就 随 之 发 生变 化 。 
1.1.2 ”多 媒体 与 多 媒体 技术 

多 媒体 的 英文 是 “Multimedia”。 目 前 国内 对 “Multimedia” 一 词 的 译 法 不 一 ， 译 为 “多 
媒体 “多 媒质 ”或 “多 媒介 ”的 均 有 之 。 这 是 中 文 的 多 义 性 的 缘故 ， 它 们 没有 什么 区 别 。 

我 们 所 说 的 “多 媒体 ”， 不 只 是 说 多 媒体 信息 本 身 ， 而 主要 是 指 处 理 和 应 用 它 的 技术 。 因 
此 ,“ 多 媒体 ”常常 被 当 作 “多 媒体 技术 ”的 同 义 语 。 

关于 多 媒体 的 定义 或 说 法 ， 目 前 仍 没有 统一 的 标准 ， 事 实 上 也 是 多 种 多 样 的 ， 各 人 从 自 
己 的 角度 出 发 对 多 媒体 有 不 同 的 描述 。 为 了 更 准确 地 了 解 多 媒体 概念 ， 首 先 来 看 一 下 国内 图 
若干 不 同 的 定义 或 说 法 。 
























































1 章 . 有.. 

















下 多 媒体 技术 必 其 应 用 (第 己 矿 ) 
定义 1(Lippincatt，Byte，1990 年 ): 计算 机 交互 式 综合 处 理 多 种 媒体 信息 一 一 文本 、 图 形 、 

图 像 和 声音 ， 使 多 种 信息 建立 逻辑 连接 ， 集 成 为 一 个 系统 并 且 具 有 交互 性 。 

定义 2(J. Morgan，SGI，1992 年 ): 多 媒体 是 传统 的 计算 媒体 一 一 文字 、 图 形 、 

辑 分 析 方 法 等 与 视频 、 音 频 及 为 了 知识 创建 和 表达 的 交互 式 应 用 的 结合 体 。 























图 像 及 逻 











定义 3( 汪 ，CW，1994 年 ): 所 谓 多 媒体 技术 就 是 能 对 多 种 载体 (媒介 ) 上 的 信息 和 多 种 存 


储 体 (媒质 ) 上 的 信息 进行 处 理 的 技术 。 


定义 4( 马 ，CIW，1994 年 ): 多 媒体 是 声音 、 动 画 、 文 字 、 图 











多 媒体 系统 是 指 用 计算 机 和 数字 通信 网 技术 来 处 理 和 控制 多 媒体 信息 的 系统 。 








图 像 、 图 形 、 动 画 、 音 频 、 视 频 等 各 种 方法 表示 。 















































于 多 媒体 内 涵 太 宽 ， 应 用 领域 太 广 ， 至 今 还 无 人 能 下 一 个 非常 确切 的 定义 。 
一 般 说 来 ， 多 媒体 的 “多 ”是 其 多 种 媒体 表现 ， 多 种 感官 作 "3 洛 种 设备 ， 多 学 科 交汇 ， 


像 和 录像 等 各 种 媒体 的 组 合 。 

















定义 5([ 美 ]，Ralf Steinmetz，Klara Nahrstedt，2000 年 ): 多 媒体 就 是 计算 机 信息 用 文本 、 


多 领域 应 用 ;“ 媒 ”是 指 人 与 客观 事物 之 中 介 ;“ 体 ”是 言 其 综合 、 集 成 一 体 化 。 目 前 ， 多 媒 

















体 大 多 只 利用 了 人 的 视觉 、 听 觉 。“ 虚 拟 现实 ”中 也 只 用 3 

















来 ， 对 于 视觉 也 主要 在 可 见 光 部 分 ， a 的 涵义 和 范围 还 将 扩 


些 年 出 现 的 体感 游戏 ， 突 破 以 往 单纯 
作 变 化 来 进行 (操作 ) 的 新 型 电子 游戏 。 





弥 雅 瑜伽、 爱 动 网 球 等 体感 运动 游戏 ， 以 及 iEhohe 上 著名 的 保龄球 游戏 和 
OO 

音 ) 师 形 S 图 像 、 文 字 、 文 本 \ 动画 、 体 态 等 多 种 媒体 结合 
一 起 ， 形 成 一 个 有 机 的 整体 , > 能 实现 一 定 的 功能 ， 就 称 之 为 多 媒体 。 
综 上 所 述 ,我 们 可 认为 :多 媒体 是 融合 两 种 











一 般 的 说 法 是 将 影像 、 声 音 ， 





在 这 个 定义 中 需要 明确 以 下 几 点 。 
(1) 多 媒 
体 的 功能 是 一 样 的 

(2) 多 媒体 是 人 -机 交互 式 媒体 ， 








角 


以 手柄 、 按 
代表 游戏 如 ， 


这 里 的 “机 ”目前 主要 是 指 计算 机 , 或 者 
的 其 他 终端 设备 。 因 为 计算 机 的 一 个 重要 特性 是 “交互 性 ”， 使 用 它 就 比较 容易 实现 人 -机 
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外 党 ， 而 味觉、 噢 觉 尚 未 集成 进 
展 ， 如 近 
游戏 操作 方式 ， 是 一 种 通过 肢体 动 








ii 上 的 网 球 游戏 ，idong 上 的 旋风 乒乓 、 























PlayStation Move 


A AH 
人 > 
计 息 交流 和 传播 的 媒体 ,从 这 个 意义 上 说 ， 多 媒体 和 电视 、 报 纸 、 杂 志 等 媒 


微 处 理 器 控 


交互 功能 。 从 这 个 意义 上 说 ， 多 媒体 和 目前 大 家 所 熟悉 的 模拟 式 电视 、 报 纸 、 杂 志 等 媒体 是 


大 不 相同 的 。 


(3) 多 媒体 信息 都 是 以 数字 的 形式 而 不 是 以 模拟 信号 的 形式 存储 和 传输 的 。 


(4) 传播 信息 的 媒体 的 种 类 很 多 ， 如 文字 、 声 音 、 图 形 、 图 








像 、 动 画 等 。 虽 然 融合 任何 两 


种 以 上 的 媒体 就 可 以 称 为 多 媒体 , 但 通常 认为 多 媒体 中 的 连续 媒体 (声音 和 电视 图 像 ) 是 人 与 机 


器 交互 的 自然 的 媒体 。 














所 谓 多 媒体 技术 ， 就 是 采用 计算 机 技术 把 文字 、 声 音 、 图 形 、 图 像 和 动画 等 多 媒体 综合 


一 体 化 ， 使 之 建立 起 逻辑 连接 ， 并 能 对 它们 获取 、 有 月 





单 地 说 ， 多 媒体 技术 就 是 把 声 、 文 、 
1.1.3 ”多 媒体 技术 的 特点 


图 、 像 和 计算 机 























集成 在 一 起 的 技术 。 





展示 。 简 


多 媒体 技术 强调 的 是 交互 式 综合 处 理 多 种 信息 媒体 (尤其 是 感觉 媒体 ) 的 技术 。 从 本 质 上 来 
看 ， 它 具有 信息 载体 的 多 样 性 、 集 成 性 和 交互 性 这 3 个 主要 特征 。 
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效果 


加 用 
和 使 
多 媒 
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使 人 


术 的 
1984 





1 总 
各 这 技术 榜 | 区 


1. 多 样 性 


多 样 性 是 相对 于 计算 机 而 言 的 ， 指 的 是 信息 媒体 的 多 样 性 ， 又 称 为 多 维 化 。 把 计算 机 所 
理 的 信息 空间 范围 扩展 和 放大 ， 而 不 再 局 限于 数值 、 文 本 或 被 特别 对 待 的 图 形 与 图 像 。 
对 于 信息 的 接收 和 产生 主要 靠 视 觉 、 听 觉 、 触 觉 、 嗅 觉 和 味觉 。 在 这 5 个 感觉 空间 中 前 
占 了 95% 以 上 的 信息 量 。 不 过 ， 计 算 机 远 远 达 不 到 人 类 的 水 平 ， 计 算 机 在 许多 方面 必须 
人 类 的 信息 进行 变形 之 后 才 可 使 用 。 多 媒体 是 要 把 机 器 处 理 的 信息 多 样 化 或 多 维 化 。 多 
的 信息 多 维 化 不 仅 指 输入 ， 而 且 还 指 输出 ， 目 前 主要 包括 听觉 和 视觉 两 方面 。 但 输入 和 
并 不 一 定 都 是 一 样 的 ， 对 于 应 用 而 言 ， 前 者 称 为 获取 ， 后 者 称 为 表现 。 若 两 者 相同 ， 则 
称 之 为 记录 和 重 放 。 如 果 对 其 进行 变换 、 组 合 和 加 工 ， 即 我 们 所 说 的 创作 ， 则 可 以 大 大 
信息 的 表现 力 和 增强 效果 。 信息 媒体 多 样 性 使 计算 机 所 能 处 理 的 信息 范围 从 传统 的 数值 、 





































































































、 静 止 图 像 扩展 到 音频 和 视频 信息 。 
,人 
2 SN 
集成 性 又 称 综合 性 。 多 媒体 的 集成 性 主要 表现 在 趟 7 而 多 媒体 信息 媒体 的 集成 ， 以 
理 这 些 媒体 的 设备 的 集成 。 rR 


这 种 集成 包括 信息 的 多 通道 统一 获取 、 多 媒体 信息 的 统一 存储 与 组 织 、 多 媒体 信息 表现 
等 各 方面 。 多 媒体 的 某 些 设备 应 该 集成 为 兰 体 ;从 硬件 来 说 ， 应 该 具有 能 够 处 理 多 媒体 
的 高 速 及 并 行 的 CPU(Central Processing Urit， 中 央 处 理 器 ) 系 统 ， 大 容量 的 存储 器 ， 适 合 
人 。 对 于 软件 来 说 ， 应 该 有 集成 一 
的 多 媒体 操作 系统 、 适 合 多 媒体 信息 管理 和 使 用 的 较 人 和 创作 工具 、 高 效 的 多 媒体 
Ways < 
:六 NS 

荐 / 纪 

交互 性 是 多 绊 体 技术 的 关键 特性 ， 使 人 从 获取 和 使 用 信息 变 被 动 为 主动 。 交 互 性 可 以 增 
户 对 信息 的 注意 力 和 理解 ， 延 长 信息 保留 的 时 间 。 交 互 性 将 向 用 户 提 供 更 加 有 效 地 控制 
信息 的 手段 ， 同 时 也 为 应 用 开辟 了 更 加 广阔 的 领域 。 可 以 想象 ， 交 互 性 一 旦 被 赋予 了 
体 信息 空间 ， 可 以 带 来 非常 大 的 影响 。 我 们 从 数据 库 中 检 录 出 某 人 的 照片 、 声 音 及 文字 
， 这 便 是 多 媒体 的 初级 交互 应 用 通过 交互 特性 使 用 户 介 入 到 信息 过 程 中 ， 而 不 仅仅 是 获 
息 ， 这 是 中 级 交互 应 用 ; 虚拟 现实 (Virtual Reality，VR) 技 术 的 发 展 及 虚拟 环境 的 实现 ， 
们 完全 进入 一 个 与 信息 环境 一 体 化 的 虚拟 信息 空间 ， 这 就 是 高 级 的 交互 式 应 用 。 















































1.2 多 媒体 技术 的 发 展 





多 媒体 计算 机 技术 最 早起 源 于 20 世纪 80 年 代 中 期 。 随 着 计算 机 软件 技术 和 硬件 制造 技 
不 断 进 步 ,计算 机 应 用 的 日 益 普及 与 深入 ， 人 们 希望 提供 一 种 更 为 自然 的 人 机 交互 方式 。 
年 美国 Apple 公司 在 Macintosh 计算 机 中 增加 了 图 形 处 理 功能 , 使 用 了 位 图 (Bitmap)、 窗 













































































口 (Window)、 图 符 (Icon) 等 技术 。 这 一 系列 改进 所 带 来 的 图 形 用 户 界面 (Graphical User Interface， 
GUD 改 善 了 人 机 交互 , 深 受用 户 的 欢迎 。1987 年 Apple 公司 又 引入 了 “超级 卡 ”(HyPer card)， 


使 多 





























媒体 信息 的 组 织 与 管理 更 容易 ， 受 到 计算 机 用 户 的 一 致 好 评 。 





1985 年 ,美国 Commodore 公司 














采 
形 


有 


屋 
量 


发 


DVD)， 该 系统 可 以 利用 
放 。DVI 将 编 /解码 器 置 于 微型 计算 机 中 ， 是 由 


< 互 式 紧凑 光盘 系统 )， 
量 光 盘 的 发 
音 、 文 字 、 














自己 专用 
1986 年 ， 





芯片 AgnuS 8370、 音 
的 操作 系统 ， 色 
荷兰 Philips 公 











展 产生 了 








展 。 
1987 和 











计算 机 对 存 


从 司 和 日 本 Sony 公 


政史 并 体 找 坟 肥 其 应 用 第 之 服 ) 
首先 推出 了 世界 上 第 一 





， 美 国 无 线 电 公司 (RCA) 推 出 了 交互 式 数字 视频 系统 (Digital Video Interactive， 
的 静态 图 像 、 视 频 、 声 音 及 数据 进行 检索 、 
微型 计算 机 控制 完成 i 


储 在 光盘 上 














技术 与 计算 机 技术 融合 在 一 起 ;而 CD-I 只 是 用 来 


ne 
式 编码 的 视频 信号 (类 似 于 后 来 的 VCD 播放 器 )。DVI 技术 出 现 之 后 ， 
\ 处 理 与 传输 ( 即 通信 ) 技 术 的 
， 该 组 织 1991 年 更 名 汶 奖 下 多 媒体 协会 ninetive 


反 
成 了 


响 ， 它 清楚 地 展现 出 信息 
立 了 交互 声 像 工业 协会 


Association，IMA) 时 ， 已 经 有 多 个 国家 的 200 几 个 公 司 加 入 了 该 协会 


的 交互 式 数字 视频 系统 DVI 卖 给 了 美国 通用 电气 (GE) 公 司 。1987 年 ,Intel 公 

:经 过 波 进 ， 于 1989 年 初 把 DVI 技术 开 
公司 合作 在 XComdex- Fall' 89 展示 会 上 推出 Action Media 750 多 媒 

系统 省 频 极 、 视频 析 和 多 六 能 核 块 等 专用 播 板 4 

于 DOS 系统 的 音 音频 视频 支撑 系 系统 (Audio Video 8 port' System, AVSS)。 

1991 年 ，Intel 和 了 TBM 合作 又 推出 了 了 改进 型 的 ction Mediall。 该 系统 芯 


术 
及 
体 


采 


， 又 把 DVI 从 GE 公司 买 到 手 ， 
的 商品 。 随 后 又 和 IBM 公 
开发 平台 。 该 平台 硬件 


集 板 和 用 户 板 两 个 专 / 


4 按照 CD-I 压缩 编码 方 


的 发 展 方向 。 


台 多 媒体 计算 机 Amiga 系统 .Amiga 
用 Motorola M68000 微 处 理 器 作为 CPU, 并 配置 了 Commodore 公司 研制 的 3 个 专 
; 频 处 理 芯片 Paula 8364 和 视频 处 理 
能 处 理 多 任务 ， 并 具有 下 拉 菜 单 、 多 窗口 和 图 符 等 功能 。 

AN 司 联合 研制 并 推出 CD-I(Compact Disc Interactive， 
同时 公布 了 该 系统 所 采用 的 CD-ROM 的 数据 格式 。 这 项 技术 对 大 容 
巨大 影响 ， 并 经 过 ISO 的 认可 成 为 国际 标准 。CD-ROM 的 出 现 为 存储 声 
图 像 和 视频 等 高 质量 的 数字 化 媒体 提供 了 有 效 手段 ， 极 大 地 推动 了 多 媒体 技术 

















图 








芯片 ( 











芯片 Denise 8362)。Amiga 具 


的 


四 
翘 


算 的 ， 这 就 把 彩色 电视 





在 世界 范 
国际 - 








引起 巨大 的 
-在 1987 年 
Multimedia 
后 来 把 推出 
司 看 中 了 这 项 技 
发 成 为 一 种 可 普 














。RCA 公司 
人 


成 ， 其 硬件 是 基 





硬件 部 分 集中 在 





用 插件 上 ， 集成 程度 更 高 ， 软件 采用 基于 Windows 的 音频 视频 内 核 


(Audio Video Ker 1el; AVK). Action Mediall 在 扩展 性 、 可 移植 性 和 视频 处 理 能 力 等 方面 均 大 


大 








届 B 





改善 。 








1991 年， 第 六 














展 出 了 多 媒体 技术 应 





成 果 ， 引 起 了 


1992 年 ，Microsoft 公司 推出 了 视窗 操作 系统 一 一 Windows 3.1， 
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标 
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术 ， 








对 菜单 命令 进行 操作 ， 极 大 地 简 
还 增加 了 多 个 具有 多 媒体 功能 
技术 ， 使 得 Windows 3.1 成 为 真 
和 大 规模 集成 电路 制造 技术 的 发 
种 处 理 音频 、 视 频 的 专 
于 多 媒体 技术 是 一 种 综合 性 技术 











上 板 卡 纷纷 面世 ， 使 多 媒体 计算 机 的 发 
， 它 的 实用 化 涉及 计算 机 、 电 子 、 通 信 、 


际 多 媒体 技术 和 CD-ROM 大 会 标志 着 多 媒体 技术 进 
阶段 , 宣布 了 CD-ROM / XA 扩充 结构 标准 的 审定 版 本 。 同年, 在 美国 








了 国际 上 许多 大 公司 的 关注 。 








个 里 程 碑 。Windows 3.1 是 一 个 多 任务 的 图 形 化 操作 环境 ， 使 用 





化 了 操作 系统 的 使 用 。 


正 的 多 媒体 操作 系统 。 与 此 同 
展 ， 为 多 媒体 设备 的 研制 打下 











术 的 协作 ， 其 产品 的 应 用 目标 既 
标准 化 问题 是 多 媒体 技术 实用 化 

















随 着 多 媒体 技术 的 发 展 ， 为 建立 相应 的 标准 ，1990 年 11 月 Philips 











的 关键 。 














它 综合 了 原 有 操作 系统 的 
软件， 如 媒体 播放 器 、 录 音 机 及 一 系列 支持 多 媒体 处 理 
叶 ， 
了 坚实 的 理论 和 
展 和 应 用 进入 了 


面向 研究 人 员 也 面向 普通 消费 者 ， 涉 及 各 个 





人 新 的 发 展 
的 计算 机 博览 会 上 首次 


成 为 计算 机 
图 形 菜单 ， 


作 系统 发 
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的 阶段 。 
多 个 行业 
层次 ， 因 


影视 科 











论 
技 
新 
等 
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公司 等 14 家 厂商 组 成 


多 媒体 市 场 协 会 应 运 而 生 , 这 个 协会 所 定 的 技术 规格 为 MPC(Multimedia Personal Computer， 


1 章 . 有 


| 起 一 六 

多 媒体 个 人 计算 机 )。MPC 标准 的 第 一 个 层次 是 以 VGA 为 输出 设备 , 在 PC 或 兼容 机 基础 上 ， 
以 窗口 技术 为 软件 支撑 环境 ， 配 一 些 多 媒体 输入 输出 设备 (如 CD-ROM 了 驱动器、 声卡 和 视频 
卡 等 )， 完 成 简单 的 多 媒体 功能 和 交互 式 功能 ， 用 于 教育 培训 或 家 庭 娱乐 。 第 二 个 层次 是 在 通 
个 人 计算 机 硬件 和 软件 平台 上 ， 设 计 制 造 了 与 多 媒体 技术 有 关 的 专用 的 硬 、 软 件 。Amiga 
系统 设计 了 专用 的 动画 、 音 频 及 图 形 处 理 芯片 。 同 时 ， 还 设计 了 实时 多 任务 操作 系统 Amiga 
Vision 多 媒体 著作 语言 及 完备 的 图 符 编程 语言 。 Apple 公司 的 QuickTime 是 一 个 不 依赖 硬件 的 
MAC 操作 系统 的 扩展 , 它 为 该 系统 增加 了 管理 数字 视频 的 协议 , 使 用 户 像 管理 静态 图 像 一 样 ， 
管理 与 时 间 有 关 的 数据 。 此 外 ， 它 为 用 户 提 供 了 一 个 标准 方式 复制 、 显 示 、 压 缩 和 粘贴 基于 
时 间 的 数据 。 第 三 个 层次 是 多 媒体 工作 站 系统 ，SUN、HP、SGI、DEC 及 IBM 等 公司 推出 的 
工作 站 都 逐渐 配 有 多 媒体 技术 ， 这 是 功能 比较 强 的 多 媒体 系统 。 

进入 21 世纪 ， 各 种 新 的 多 媒体 应 用 层出不穷 ， 为 多 坚 体 技术 的 迅 这 发 展 提供 于 新 的 机 遇 
与 动力 。 值 得 一 提 的 有 以 下 3 方面 。 

(1) 以 Apple 公司 的 iphone 为 代表 的 智能 手机 的 广 泛 使 用 此 二 了 移动 多 媒体 技术 的 迅 
速 发 展 。Apple 公司 2011 年 发 布 的 iPhone 4S 是 - - 款 触摸屏 智能 本 机 如 图 1.2 所 示 。iPhone 4S 
搭载 苹果 最 新 的 iOS 5 操作 系统 ， 支 持 iCloud 云 服务 ; 江 最 大 的 特色 在 于 语音 控制 ， 基 于 Siri 
的 语音 系统 ，iPhone 4S 将 成 为 更 加 智能 的 语 音 识别 设备 ， 可 以 和 iPhone 4S 通过 语音 控制 实 
现 天 气 、 短 信 、 地 图 查找 等 功能 的 交互 。iOS $ 其 他 的 功能 还 包括 全 新 的 通知 中 心 、 iMessage 
即时 通信 功能 、Newsstand 报刊 杂志 、Rerninders 提醒 事项 、 经 过 优化 的 Twitter、 经 过 优化 的 
拍照 及 照片 编辑 功能 、 升 级 的 Safari 浏览 器 、 无 需 连接 计 算 机 激活 且 经 过 优化 的 邮件 功能 、 
更 强大 的 Game Center 等 。 利 / 日 该 手 和 可 实现 双向 视频 通 请 J 如 图 1.3 所 示 。 


计生 


| 


图 1.2 iPhone 4S 触摸 屏 智 能 手机 图 1.3 双向 视频 通话 


(2) 移动 多 媒体 技术 。 随 着 无 线 网 络 和 多 媒体 通信 技术 的 发 展 , 移动 多 媒体 业务 得 到 越 来 
越 广泛 的 应 用 ， 主 要 有 多 媒体 广播 、 电 视 技术 、3G、4G 移动 通信 中 的 多 媒体 通信 技术 及 应 
用 等 。 
(3) 新 型 的 游戏 控制 方法 。 电视 游戏 是 一 种 用 来 娱乐 的 交互 式 多 媒体 。 通常 是 指使 用 电视 
屏幕 为 显示 器 ， 在 “电视 游乐 器 ”上 运行 家 用 机 的 游戏 ， 近 年 来 ， 一 种 通过 肢体 动作 变化 来 
进行 (操作 ) 的 新 型 电子 游戏 一 一 体感 游戏 技术 成 为 新 的 亮点 。 在 游戏 中 , 玩家 们 用 脚 踢 仅 存在 
于 屏幕 中 的 足球 ， 并 用 手 设法 拦阻 进 球 ; 在 驾驶 游戏 中 ， 玩 家 转动 想象 中 的 方向 盘 来 操控 电 
视 游戏 中 的 赛车 ; 在 网 球 游戏 中 玩家 们 挥动 手中 的 手柄 ， 可 控制 游戏 中 网 球 的 接 球 点 、 方 向 、 
力度 等 ， 让 人 有 身 临 其 境 的 真实 感 。 著 名 的 平台 有 以 下 几 种 。 
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下 和 媒 体 技术 及 其 应 用 (第 之 版) 

一 ”四 Wii 一 一 日 本 任天堂 公司 (Nintendo)2006 年 11 月 19 日 所 推出 的 家 用 游戏 主机 ,如 图 1.4 
所 示 。Wii 属于 第 七 代 家 用 游戏 机 。 前 所 未 见 的 控制 器 使 用 方法 、 怀旧 主机 游戏 软件 贩卖 下 载 、 
无 关 游 戏 的 生活 资讯 内 容 、 运 用 网 络 的 功能 及 各 项 服务 等 均 为 Wii 的 主要 特色 。 

@@ PS Move 一 一 索尼 新 一 代 体 感 设备 。 全 称 PlayStation Move 动态 控制 器 , 它 和 PlayStation3 
USB 摄影 机 结合 ， 创 造 全 新 游戏 模式 。PS Move 不 仅 会 辨识 上 下 左右 的 动作 ， 还 会 感应 手腕 
的 角度 变化 。 所 以 无 论 是 运动 般 的 快速 活动 还 是 用 笔 绘 画 般 纤细 的 动作 也 能 在 PS Move 
现 ， 如 图 1.5 所 示 。 动 态 控制 器 亦 能 感应 空间 的 深度 ， 感 受 轻松 逼真 的 游戏 。 
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, 
图 1.4 Wii 游戏 机 ~ 图 1.5 索尼 体感 手柄 
@ Kinect 一 一 Microsoft 在 2010 年 6 月 14E Xbox360 体感 周边 外 设 正式 发 布 的 名 称 。 
伴随 Kinect 名 称 的 正式 发 布 ，Kinect 还 推出 了 多 款 配套 游戏 ， 包括 Lucasarts 出 品 的 《星球 大 
战 入 MTV 推出 的 跳舞 游戏 (如 图 1. 6 所 示 宠物 游戏 、 运动 游戏 Kinect Sports、 冒 险 游戏 Kinect 
Adventure、 赛 车 游戏 Joyride 等 。。 自前 体感 游戏 技术 当 数 Misiosoft Xbox360 而 领先 国际 ， 而 
在 国内 ， 由 代 代 星 以 恢 入 式 万 式 所 供给 海信 智能 电视 的 “运动 大 本 营 ” 摄像 头 也 小 有 名 气 。 
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图 1.6 体感 游戏 


1.3 ”多 媒体 系统 的 构成 


多 媒体 系统 可 以 从 狭义 和 广义 上 分 类 。 从 狭义 上 分 ， 多 媒体 系统 就 是 拥有 多 媒体 功能 的 
计算 机 系统 ;从 广义 上 分 ， 多 媒体 系统 就 是 集 电话 、 电 视 、 媒 体 、 计 算 机 网 络 等 于 一 体 的 信 
息 综合 化 系统 。 


| 


eee 
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多 媒体 系统 由 多 媒体 硬件 系统 和 多 媒体 软件 系统 两 部 分 组 成 。 其 中 ， 硬 件 系统 主要 包括 
计算 机 主要 配置 和 各 种 外 部 设备 及 与 各 种 外 部 设备 的 控制 接口 卡 (包括 多 媒体 实时 压缩 和 解 
压缩 电路 )， 软 件 系统 包括 多 媒体 驱动 软件 、 多 媒体 操作 系统 、 多 媒体 数据 处 理 软件 、 多 媒体 
创作 工具 软件 和 多 媒体 应 用 软件 。 

随 着 手机 及 各 类 平板 计算 机 的 大 量 使 用 及 对 多 媒体 全 方位 的 支持 ， 基 于 移动 计算 平台 的 
操作 系统 也 发 挥 越 来 越 大 的 作用 ， 主 要 有 以 下 几 种 。 

1. Android 系统 


Android 是 一 种 以 Linux 为 基础 的 开放 源 代码 操作 系统 ， 主 要 用 于 便携 设备 。 目 前 尚未 有 
统一 中 文 名 称 ， 一 般 称 为 “ 安 卓 ”或 “ 安 致 "。Android 操作 系统 最 初 由 Andy Rubin 开发 ， 最 
初 主要 支持 手机 。2005 年 由 Google 收购 注资 ,并 组 建 开 放手 机 联盟 开发 改良 ,逐渐 扩展 到 平 
板 计 算 机 及 其 他 领域 上 。Android 的 主要 竞争 对 手 是 Apple 公司 的 "OS 及 Microsoft 公司 的 
Windows Phone。Android 的 移动 多 媒体 系统 主要 包括 Java 框架 只 架 层 (Media APT) 
及 OpenCore。 Java 框架 层 上 面 和 Java 应 用 层 相连 , Java 框 \C 语言 do 的 中 间 是 Java 
本 地 调用 部 分 (Media JND。Android 多 媒体 部 分 的 C 语言 部 分 的 核心 是 media 库 , 它 主要 提供 
了 媒体 播放 器 和 媒体 记录 器 的 框架 .media 库 库 向 上 层 通过 I 提供 接口 , 下 层 通 过 Packet Video 


等 实现 。 XxX 
2，iOS 系统 SS 六 


Apple iOS 是 由 Apple 公司 开 的 平 特 设备 操作 系 统 。 Apple 公 \ 司 最 早 于 2007 年 1 月 9 
日 的 Macworld 大 会 上 公布 这 个 系统 ; 最 初 是 设计 给 合 iPFgns 使 用 的 ， 后 来 陆续 套用 到 iPod 
touch、iPad 及 Apple 电视 机 等 Apple 产品 上 。iOS 与 : Wpple 的 Mac OSX 操作 系统 一 样 ， 它 也 
是 以 Darwin 为 基础 的 ,因此 同样 属于 类 UNIX Me 作 系 统 .原本 这 个 系统 名 为 iPhone OS， 
直到 2010 年 6 月 7 了 >WWDC 大 会 上 宣布 改名 为 OS。 截至 2011 年 11 月 ， 根 据 Canalys 的 
数据 显示 ， le 机 系统 箱 2 吉 的 30%， 在 美国 的 市 场 占有 率 为 43%。 

3. Windows 























































































































Windows 8 是 Microsoft 公司 研发 中 的 下 一 代 计 算 机 操作 系统 ， 适 用 于 平板 计算 机 、 笔 记 
本 和 桌 上 计算 机 等 多 平台 ,该 系统 除了 具备 Microsoft 公司 的 传统 视窗 系统 显示 方式 外 ， 特 别 
强化 适用 于 触 控 屏幕 的 平板 计算 机 设计 ， 使 用 类 似 Windows Phone 操作 系统 的 动态 方块 (live 
tiles) 界 面 ， 新 系统 亦 加 入 可 透 过 官方 网 上 商店 Windows Store 购买 软件 等 新 特性 。Windows 8 
被 认为 是 Microsoft 反击 主导 平板 计算 机 及 智能 手机 操作 系统 市 场 的 Apple iOS 和 
Google Android 的 操作 系统 。 


1.3.1 基本 组 成 


多 媒体 系统 所 处 理 的 对 象 主要 是 声音 和 图 像 信号 。 声 音 和 图 像 信 号 的 特点 是 速率 高 、 数 
据 量 大 、 实 时 性 高 。 因 此 ， 多 媒体 系统 的 基本 组 成 应 包括 : 计算 机 ， 视 听 接 口 、 音 响 及 图 像 
设备 , 高 速 信号 处 理 器 (用 于 实时 图 像 和 声音 处 理 )， 大 容量 的 内 、 外 存储 器 ,以 及 软件 。 通常 ， 
多 媒体 系统 没有 固定 的 配置 模式 ， 但 一 般 包 括 以 下 一 些 部 件 。 

(1) 计算 机 ， 可 以 是 个 人 计算 机 、 平 板 计算 机 、 智 能 手机 、 工 作 站 等 。 

(2) 音频 、 视 频 、 图 像 处 理 单元 等 。 该 处 理 单元 可 以 是 集成 在 主板 上 的 专用 芯片 或 专门 的 
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使 计算 机 能 够 集 声 ” 文 、 图 、 像 处 理 于 一 体 ! 人 类 发 明了 有 多 媒体 处 理 能 力 的 计算 机 。 使 
最 多 的 是 多 媒体 个 人 计算 机 (MPC)。 所 谓 多 媒体 个 人 计算 机 就 是 具有 了 多 媒体 处 理 功能 的 个 
人 计算 机 ， 它 的 硬件 结构 与 一 般 所 用 的 个 人 计算 机 六 
件 配 置 而 已 。 其 实 ， 现 在 我 们 所 购买 的 个 人 计算 机 绝 大 多 数 都 具有 了 多 媒体 应 用 功能 。 一 
的 多 媒体 系统 如 图 1.8 所 示 。 一 般 来 说 ，MPC 的 基本 硬件 结构 可 以 归纳 为 7 部 分 。 
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， 包 括 音频 卡 、 视 频 卡 、 图 像 处 理 卡 等 。 


(3) 声 像 输入 设备 ， 如 话 简 、 录 音 机 ( 笔 )、 手 机 、 摄 像 机 、 光 盘 等 。 

(4) 声 像 输出 设备 ， 如 电视 机 、 传 声 机 、 合 成 器 、 可 读 写 光盘 、 耳 机 等 。 
(5) 软件 ， 实 时 多 任务 支持 软件 、 多 媒体 应 用 软件 。 

(6) 控制 部 件 ， 如 鼠标 、 键 盘 、 光 笔 、 触 摸 式 屏幕 等 。 

多 媒体 系统 是 多 媒体 计算 机 系统 的 简称 。 现 以 具有 编辑 和 播放 功能 的 多 媒体 开发 系统 为 
例 ， 介 绍 多 媒体 系统 的 硬件 结构 及 软件 结构 。 简 化 的 多 媒体 系统 如 图 1.7 所 示 。 








数字 信和 号 输入 数字 信号 输出 


声 亲 输 出 















话 简 、 录 音 笔 、 光 盘 、 
MIDI 合 成 器 、 玫 机、 
磁盘 、SD 卡 、U 盐 等 


轿 像 组 入 


担 像 柱 、 数 码 照 相机 、 a 显示 加 、 打 印 机 、 电 
所 描 仪 、 光 瞄 、 视 机 、 投 影 仪 、 玫 机 、 
磁盘 、SD 卡 、 避 盘 等 《 媒 盘 、SD 卡 、U 盘 等 












4 简化 的 多 媒体 系统 
Es rz 
1.3.2 多 媒体 系统 的 硬件 结构 < x 


我 们 可 以 交 多 如 人 系统 角 为 统计 和 机 和 六 ， 传统 的 计算 机 系统 所 处 理 的 信息 
往往 仅 限于 文字 和 数学 ， 人 机 之 间 的 交互 其 能 通过 键盘 和 显示 器 , 为 了 改善 人 机 交互 的 接口， 
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Q 至 少 一 个 功能 强大 、 速 度 快 的 中 央 处 理 器 ; 


@ 可 


| 管理、 控制 各 种 接口 与 设备 的 配置 ; 


@ 具有 一 定 容量 ( 尽 可 能 大 ) 的 存储 空间 ; 
图 高 分 辩 率 显示 接口 与 设备 ; 


© 可 


[处理 音 响 的 接口 与 设备 ; 





© 





处 理 图 像 的 接口 设备 ; 














可 





[存放 大 量 数据 的 配置 与 接口 等 。 











fF 无 太 大 的 差别 ， 只 不 过 是 多 了 一 些 软 硬 




















般 


这 样 提 供 的 配置 是 最 基本 MPC 的 硬件 基础 ， 它 们 构成 MPC 的 主机 。 除 此 以 外 ，MPC 能 
扩充 的 配置 还 可 能 包括 以 下 几 个 方面 。 








图 1.8 多 媒体 系统 示意 图 


(1) 光盘 驱动 器 : 包括 可 重 写 光盘 (CD-RW) 驱 动 器 、WORM 莫 动 器 和 CD-ROM 驱动 器 。 
其 中 CD-ROM 驱动 器 为 MPC 带 来 了 价格 低廉 的 存储 设备 ,、 . 存 有 图 形 、 动画 、 图 像 、 声 音 、 
文本 、 数 字音 频 、 程 序 等 资源 的 CD-ROM 早已 广泛 使 用 、 因此 现在 光驱 对 广 大 用 户 玉 说 忆 
是 必需 配置 的 ， 而 可 重 写 光盘 、WORM 光盘 价格 较 高 ， 目前 还 不 是 非常 普及 。 另 外 ，DVD 
存储 量 更 大 ， 双 面 可 达 17GB， 是 升级 换代 的 理想 产品 。 

(2) 音频 卡 : 在 音频 卡 上 连接 的 音 频 蛤 入 入 贞 设备 包括 话 从 音频 播放 设备 、MIDI 合成 
器 、 耳 机 、 扬 声 器 等 。 i 面 ， 音 频 卡 具有 A/D 和 
D/A 音频 信号 的 转换 功能 ， 可 以 合 F 诚 音乐、 昆 合 多 种 声 源 世 还 可 以 外 接 MIDI 电子 音乐 设备 。 

(3) 图 形 加 速 卡 : 1 分 淹 率 高 ; 而 且 同 屏 显 示 色 彩 丰 富 的 显示 卡 
的 支持 ， 同 时 还 要 求 具有 Windows 的 显示 驱动 程序 ， 并 在 Windows 下 的 像素 运算 速度 要 快 。 
所 以 现在 带 有 图 形 用 户 接口 (GUD 加 速 器 的 局 部 | 总 线 显示 适配器 使 得 Windows 的 显示 速度 大 
大 加 快 。 SN PP 

(4) 视频 卡 ; 可 细 分 为 视频 捕 提 卡 、 视频 处 理 卡 、 视 频 播放 卡 及 TV 编码 器 等 专用 卡 ， 其 
功能 是 连接 摄像 机 、VCR 影碟 机 、 电 视 机 等 设备 ， 以 便 获取 、 处 理 和 表现 各 种 动画 和 数字 化 
视频 媒体 。 

(5) 扫描 卡 : 用 来 连接 各 种 图 形 扫描 仪 ， 是 常用 的 静态 照片 、 文 字 、 工 程 图 输入 设备 。 

(6) 打印 机 接口 : 用 来 连接 各 种 打印 机 ， 包 括 普通 打印 机 、 激 光 打 印 机 、 彩 色 打印 机 等 ， 
印 机 现在 是 常用 的 多 媒体 输出 设备 之 一 。 

(7) 交互 控制 接口 : 用 来 连接 触摸 屏 、 鼠 标 、 光 笔 等 人 机 交互 设备 ， 这 些 设 备 将 大 大 方便 
户 对 MPC 的 使 用 。 

(8) 网 络 接口 : 实现 多 媒体 通信 的 重要 MPC 扩充 部 件 。 在 计算 机 和 通信 技术 相 结合 的 时 
代 需 要 专门 的 多 媒体 外 部 设备 将 数据 量 庞大 的 多 媒体 信息 传送 出 去 或 接收 进来 ， 通 过 网 络 接 
口 相 接 的 设备 包括 视频 电话 机 、 传 真 机 、LAN 和 ISDN 等 。 

通用 的 多 媒体 系统 结构 如 图 1.9 所 示 。 它 是 一 种 交互 式 多 媒体 协作 (IMA) 体 系 结构 ， 其 研 
究 方法 是 基于 多 媒体 接口 总 线 来 定义 接口 。 多 媒体 接口 总 线 可 以 是 计算 机 系统 和 多 媒体 软 、 
硬件 资源 间 的 接口 ， 它 包括 格式 转换 器 和 翻译 器 ， 还 可 以 提供 串 式 输入 输出 服务 。 













































































































































下 多 媒体 找 坟 及 黄 应 用 (第 之 服 ) 
应 用 程序 | 


应 用 程序 莱 容 层 | 


















应 用 程序 闭 容 层 | 









对 象 文件 | 
服务 器 1 光盘 库 
人 网 络 文件 





服务 器 。 /了 民 


图 1.9 基于 多 浊 体 接口 总 线 上 的 体系 续 构 
NA 
1.3.3 ”多 媒体 系统 的 软件 结构 se 


EY 
多 媒体 系统 与 现 有 的 计算 机 系统 相 比 全 软件 的 结构 有 如 下 的 变化 。 软 件 的 结构 大 致 可 分 
为 3 个 层次 ， 如 图 1.10 所 示 。 


RN xD 
a | 痢 






1 
图 1.10 多 媒体 系统 的 软件 结构 


(1) 系统 软件 (System Software)， 音 频 、 视 频 信号 都 是 实时 信号 ， 这 就 要 求 系统 软件 具有 
实时 处 理 功能 ， 音 频 、 视 频 和 计算 机 的 其 他 操作 需要 并 行 处 理 ， 这 就 要 求 系统 软件 具有 多 任 








务 处 理 的 功能 。 因 此 ， 多 媒体 系统 的 系统 软件 应 该 是 一 个 实时 多 任务 操作 系统 (Real Time 
Operating System，RTOS)。 此 外 ， 这 层 软 件 还 包括 多 媒体 软件 执行 环境 ， 如 Windows 中 的 媒 
体 控制 接口 (Media Control Interface，MCD 等 。 
(2) 开发 工具 (Development Tools)， 它 包括 创作 软件 工具 (Creative Software Tools) 和 编辑 
软件 工具 (Authoring Software Tools) 两 部 分 。 创 作 软 件 是 针对 各 种 媒体 开发 的 工具 ， 如 视频 图 
像 的 获取 、 编 辑 和 制作 ， 声 音 的 采集 /获取 、 编 辑 ， 二 维 、 三 维 的 动画 创作 等 工具 。 编 辑 软件 
是 将 文 、 声 、 图 、 像 等 媒体 进行 综合 、 协 调 及 赋予 交互 功能 的 软件 。 目 前 ， 这 种 软件 有 基于 
描述 语言 的 ， 有 基于 图 符 的 ， 还 有 基于 超级 卡 等 方法 的 编辑 工具 。 此 外 还 有 基于 脚本 的 、 基 
于 流程 的 及 基于 时 序 的 创作 工具 等 。 

(3) 多 媒体 应 用 软件 (Multimedia Application Software)， 它 是 在 多 媒体 硬件 平台 和 创作 工 
有 具 上 开发 的 应 用 软件 ， 如 教学 软件 、 演 示 软 件 、 游 戏 、Software 百科 全 书 等 。 
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1.34 工作 站 环境 的 多 媒体 体系 结构 


多 媒体 系统 的 重要 方面 之 一 是 具有 多 样 、 综 合 、 实 时 交互 、 控 制 等 功能 。 它 必须 与 标准 
户 界面 (如 Microsoft Windows) 相 集成 。 此 外 ， 新 设计 的 系统 无 论 采用 何 种 不 同 的 多 媒体 专 
硬件 (如 DSP)， 均 不 需要 改变 软件 。 更 重要 的 是 ， 这 些 应 用 程序 在 用 各 种 硬件 接口 操作 时 

桌面 工作 站 和 微型 计算 机 中 不 断 进步 的 处 理 器 确实 为 大 多 数 应 用 软件 提供 了 可 接受 的 性 
能 。 使 用 公共 的 应 用 程序 界面 (APD 人 允许 应 用 程序 开发 商 开发 可 与 硬件 驱动 程序 及 软件 驱动 程 
序 一 起 工作 的 应 用 程序 。 通 过 使 用 软件 驱动 程序 使 得 用 户 可 操作 极为 广泛 的 外 设 和 系统 。 多 
媒体 工作 站 环境 的 体系 结构 见 表 1-1。 


表 1-1 多 媒体 工作 站 环境 的 体系 结构 


应 用 软件 
图 形 用 户 界面 多 媒体 扩展 
操作 系统 软件 驱动 程序 x | | 多 媒体 设备 驱动 支持 
深 加 的 多 媒体 设 各 和 从 设 、 
(扫描 仪 、 摄 像 机 、 音 响 及 MPEG 卡 等 ) 


在 这 个 体系 结构 中 ， 右 部 电 示 了 支撑 多 如 条 应 用 软件 所 适 的 新 的 体系 i 构 ， 左 部 与 非 多 
a chi 其 中 图 形 用 户 办 而 要 求 赤 持 应 用 软件 (如 爹 活动 视频 远程 只 面 ) 进 4 | 扩 

。 值 得 指出 的 是 ， 多 媒体 操作 不 仅 要 高 分 辩 率 : 显示 技术 此 ! 显示 技术 要 允许 一 次 能 运行 
pe 软件 ， 而 且 还 要 求 有 额外 的 资源 来 管理 各 ! 序 和 数据。 更 重要 的 是 ， 它 在 运算 性 能 及 
Wi 出 了 很 高 的 要 求 。 XK Xx 


NA 人 1.4 多 媒体 系统 中 的 若干 技术 


NS 
多 媒体 技术 是 基于 计算 机 、 通 信和 电子 技术 发 展 起 来 的 一 个 新 的 学 科 领 域 ， 多 媒体 系统 
中 采用 的 新 技术 、 新 方法 层出不穷 。 以 下 概要 介绍 其 中 若干 技术 。 


1. 音频 /视频 信号 处 理 技 术 


音频 /视频 信号 是 多 媒体 计算 机 系统 中 重要 的 信息 表现 形式 。 日 常 的 音频 /视频 信号 大 多 以 
连续 的 模拟 量 的 形式 被 记录 、 存 储 和 播放 。 而 各 类 电子 数字 计算 机 只 能 处 理 离散 的 数字 量 ， 
所 以 就 必须 将 其 数字 化 。 本 书 将 在 第 2 章 、 第 3 章 分 别 介绍 音频 、 视 频 的 数字 化 技术 及 相关 
的 软件 及 应 用 。 


2. 数据 压缩 /解压 缩 技术 


在 多 媒体 计算 机 中 要 表示 、 传 输 和 处 理 声 文 图 信息 ， 特 别 是 数字 化 图 像 和 视频 ， 要 占 
大 量 的 存储 空间 ， 因 此 高 效 的 压缩 和 解压 缩 算法 是 多 媒体 系统 运行 的 关键 。 本 书 将 在 第 4 章 
介绍 常用 的 数据 压缩/ 解压 缩 技术 。 


3. 多 媒体 数据 存储 技术 
高 效 快速 的 存储 设备 是 多 媒体 系统 的 基本 部 件 之 一 ， 多 媒体 数据 存储 技术 是 多 媒体 技术 
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“多 让 订 接 术 肥 其 这 用 (第 之 入) 
一 中 的 关键 技术 之 一 ， 主 要 解决 如 何 保存 多 媒体 的 内 容 。 随 着 多 媒体 技术 的 发 展 ， 存 储 介质 从 








a 
最 早 的 磁带 、 磁 盘 、CD、DVD 发 展 到 蓝光 光盘 ， 存 储 容量 发 生 了 巨大 的 变化 ， 而 其 中 的 存 





储 方式 也 随 之 改变 ， 并 融入 了 新 的 压缩 算法 ， 本 书 将 在 第 7 章 中 对 相关 内 容 进 行 详细 介绍 。 
4. 多 媒体 软件 开发 技术 


为 了 便于 用 户 自行 开发 多 媒体 应 用 系统 ， 一 般 在 多 媒体 操作 系统 上 提供 有 丰富 的 多 媒体 
开发 工具 ， 如 动画 制作 软件 3D Studio、Flash (第 5 章 介 绍 )， 多 媒体 创作 系统 等 ， 这 些 工具 为 
用 户 提供 了 对 图 形 、 图 像 、 音 频 、 视 频 、 文 本 、 动 画 等 多 种 媒体 进行 编辑 、 制 作 和 合成 等 功 
能 ， 为 人 们 高 效 、 快 速 制作 各 类 多 媒体 应 用 软件 提供 方便 。 本 书 将 在 第 2 章 、 第 3 章 和 第 5 
章 对 相关 内 容 进行 详细 介绍 。 

5， 多 媒体 通信 技术 

多 媒体 技术 的 主要 目的 是 要 加 迷 和 方便 信息 的 交流 ， 从 这 个 意义 上 讲 ， 多 媒体 通信 技术 
tn a eg et 
相互 渗透 、 相 互 影响 的 结果 。 近 30 年 来 ， 随 着 信息 技术 的 发 展 ， 所 有 利用 电子 通信 的 信号 都 
相继 走 上 了 数字 化 的 道路 ， 以 致 原来 区 分 电话 机 、 2 eh 
特别 是 计 加 机 风 络 技术 、3G 通令 术 的 发 展 给 恩人 技术 的 作 民 注入 了 新 活力 本 
将 在 第 9 章 介绍 多 媒体 网 络 与 通信 技术 等 相 容 、 

6， 超 文本 与 超 媒体 SS 

超 媒 体 起 源 于 超 文本 。 超 文本 将 信息 自然 地 相连 接 ,> 秃 不 像 纸 写 文本 那样 将 结构 分 层 归 
类 ， 它 以 这 种 方式 实现 对 无 顺序 数据 的 管理 。 超 文本 系统 允许 作者 将 信息 连 在 一 起 ， 建 立 
过 文档 中 大 量 相关 文本 的 信息 路 径 ， 注 释 已 有 的 文本 X 以 及 提供 书目 信息 。 直 接 的 连接 或 者 
链接 可 以 将 文档 从 一 处 移 到 另 一 处 ， 就 像 读 者 阅 百科 全 书 中 的 参考 目录 一 样 。 超 文本 的 
使 用 能 从 多 达成 百 上 后 页 的 文本 内 容 中 快速 .简便 地 搜寻 和 阅读 所 选 的 章节 。 超 媒体 是 超 文 
本 的 扩展 ， 因 为 除 所 含 的 文本 外 ， 这 此 电子 文 档 也 将 包括 任何 可 以 以 电子 存储 方式 进行 储 
存 的 信息 ， 如 音频 、 动 画 视 频 、 图 形 或 全 运动 视频 等 。 本 书 将 在 第 6 章 介绍 超 文本 与 超 媒体 、 
多 媒体 数据 库 的 内 容 。 

7. 多 媒体 数据 库 技术 


多 媒体 的 数据 量 巨大 、 媒 体 种 类 繁多 ， 这 些 都 给 数据 管理 带 来 了 新 的 问题 。 对 于 结构 化 
数据 ， 传 统 的 数据 库 技术 提供 了 方便 的 数据 管理 功能 ， 如 查询 、 检 索 、 恢 复 、 并 发 控制 、 完 
整 性 和 存储 管理 等 。 但 对 于 图 像 、 声 音 、 视 频 等 非 结构 化 数据 ， 传 统 的 数据 库 管理 系统 不 能 
有 效 地 进行 管理 ， 因 而 要 求 使 用 新 的 多 媒体 索引 和 检索 技术 。 采 用 面向 对 象 的 数据 库 模型 来 
处 理 复杂 对 象 是 比较 理想 的 途径 ， 但 面向 对 象 的 数据 库 尚 有 许多 理论 和 实现 技术 没有 得 到 根 
本 解决 。 

多 媒体 信息 检索 是 多 媒体 数据 库 核心 问题 之 一 。 传 统 的 多 媒体 信息 的 检索 、 查 询 方法 是 
文本 将 图 像 、 视 频 、 音 频 等 其 他 非 格式 化 的 多 媒体 数据 进行 标示 ， 检 索 时 以 文本 为 基础 进 
行 的 。 随 着 多 媒体 信息 的 迅速 增加 ， 这 种 采用 对 媒体 建立 关键 词 的 文本 描述 信息 的 方式 已 越 
来 越 不 适应 现代 信息 的 检索 要 求 ， 它 主要 存在 的 局 限 性 : 叫 由 于 多 媒体 数据 量 巨大 ， 对 媒体 
加 注 文本 信息 、 分 类 与 归档 仍 由 手工 完成 ， 这 种 方法 费时 费力 ; @@ 由 于 文本 描述 信息 是 非 党 
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主观 的 ， 不 同 的 人 对 同一 媒体 有 不 同 的 理解 ， 用 文本 描述 很 难 一 致 ， 因 而 查询 时 所 要 匹配 的 
内 容 难 免 会 有 遗漏 和 错 判 。 为 了 突破 文本 检索 方式 的 吉 端 ， 必 须 从 媒体 自身 的 内 容 入 手 ， 以 
媒体 所 包含 的 内 容 信 息 作为 媒体 的 索引 ， 即 基于 内 容 的 检索 。 基 于 内 容 的 检索 就 是 根据 媒体 
对 象 的 语义 和 感知 特征 进行 检索 ， 具 体 实现 就 是 从 媒体 数据 中 提取 出 特定 的 信 
指标 )， 然 后 根据 这 些 线索 从 大 量 存储 在 多 媒体 数据 库 中 的 媒体 中 进行 查找 ， 检 索 出 具 
特征 的 媒体 数据 。 基 于 内 容 的 多 媒体 信息 检索 ， 是 一 门 涉及 面 很 广 的 交叉 学 科 ， 需 要 利用 图 
像 处 理 、 模 式 识别 、 计 算 机 视觉 、 图 像 理解 等 领域 的 知识 作为 基础 ， 还 需 从 认 知 科学 、 人 工 
智能 、 数 据 库 管理 系统 、 人 机 交互 等 领域 引入 新 的 媒体 数据 表示 和 数据 模型 ， 从 而 设计 出 可 
靠 、 有效 的 检索 算法 、 系 统 结构 及 友好 的 人 机 界面 。 

8， 三 维 技 术 和 全 息 摄影 

三 维 技术 集中 在 两 个 领域 指针 装置 和 显示 器 。 三 维 指针 装置 对 于 在 三 维系 统 中 操作 
象 来 说 是 必需 的 。 三 维 显示 可 用 全 息 摄影 技术 达到 。 开 发 全 息 报 的 技术 已 经 为 直接 用 
于 计算 机 做 了 调整 。 a EN, RR te 蓝 、 绿 
3 种 颜色 以 产生 三 维 效果 。 下 面 介绍 这 些 技术 如 何 被 多 媒体 系统 的 实际 产品 中 。 

三 维 指针 装置 和 系统 的 开发 是 迈 向 多 媒体 系统 的 一 个 重要 步 又。 美国 华盛顿 大 学 以 西 
图 为 基地 的 人 关 接口 技术 (HIT 实 验 宝 是 开发 三 维 装置 亲 先 儿 如 正 为 数字 设备 公司 开发 的 条 
码 读 入 器 技术 。 为 未 来 人 机 接口 所 设计 的 指示 方便 的 条 码 读 入 器 ， 使 计算 机 用 户 能 直接 指向 
其 数据 的 三 维 表示 。 条 码 读 入 器 可 以 像 志 标 那样 做 简单 的 选取 ， 或 者 进行 操作 符号 的 空中 
扎 寻 。 条 码 读 入 器 的 形状 像 个 小 活 问 -项 上 有 个 按钮 。 它 便 用 无 线 电波 频率 的 传感器 将 方位 
庆 息 输入 它 所 连接 的 计算 机 中 用 户 将 条 码 读 入 器 对 准 浮 在 主 维 空 间 中 的 物品 ， 按 下 按钮 来 
选中 此 物品 。 在 空中 用 它 的 尖端 曙 出 特定 的 操作 符 各 也 语 让 条 码 读 入 器 执行 特定 的 操作 。 其 
他 较 低级 的 三 维 指针 装置 包括 三 维 鼠 标 和 用 无， = = 维 软件 包 进行 通信 的 跟踪 球 等 。 

nd rp 间 显示 装置 ， 使 用 3 种 不 同 颜色 的 激光 把 





































































































图 像 投 照 到 移 这 个 移动 的 表 ee 红 、 
蓝 、 绿 激光 器 产生 的 。 三 维 显示 可 以 用 于 各 种 应 用 ， 如 医学 上 用 于 检查 和 手术 的 成 像 、 生 物 
技术 ， 以 及 任何 必须 了 解 方位 的 应 用 ， 如 空中 交通 控制 等 。 具 有 这 种 性 质 的 三 维 方式 的 显示 ， 
可 以 将 高 度 的 真实 模拟 提供 给 各 种 应 用 。 三 维 技术 和 对 现实 世界 的 真实 模拟 又 导致 了 虚拟 现 
实 ， 本 书 将 在 第 8 章 介绍 有 关 人 机 界面 及 虚拟 现实 技术 。 


9. 虚拟 现实 技术 


虚拟 现实 是 一 项 与 多 媒体 技术 密切 相关 的 边缘 技术 ， 它 通过 综合 应 用 计算 机 图 像 、 模 拟 
与 仿真 、 传 感 器 、 显 示 系 统 等 技术 和 设备 ， 以 模拟 仿真 的 方式 ， 给 用 户 提供 一 个 真实 反映 操 
纵 对 象 变化 与 相互 作用 的 三 维 图 像 环境 所 构成 的 虚拟 世界 ， 并 通过 特殊 设备 (如 头盔 式 立 体 显 
示 器 、 三 维 鼠标 和 数据 手套 ) 提 供给 用 户 一 个 与 该 虚拟 世界 相互 作用 的 三 维 交 互 式 用 户 界面 。 
利用 多 媒体 系统 生成 逼真 的 视觉 、 听 觉 、 触 觉 及 嗅觉 的 模拟 真实 环境 ， 用 户 可 以 用 人 的 自然 
技能 (如 头 部 的 转动 、 眼 睛 的 活动 、 手 势 或 其 他 身体 动作 ) 对 这 一 虚拟 的 现实 进行 交互 体验 ， 犹 
如 在 现实 生活 中 的 体验 一 样 。 虚 拟 现实 是 一 种 高 度 集成 的 技术 ， 涉 及 三 维 实时 图 形 显示 、 三 
维 定位 跟踪 、 触 觉 及 传 感 技术 、 人 工 智能 、 高 速 计算 、 并 行 处 理 和 人 的 行为 学 等 许多 方面 ， 
是 多 媒体 技术 发 展 的 理想 目标 。 






















































































































































































区 巡 订 技 坟 发 其 应 用 (第 之 腑 ) 


1.5 感知 媒体 的 基本 特性 














在 多 媒体 对 象 的 表示 中 ， 含 有 多 种 不 同 的 数据 类 型 。 基 本 类 型 应 包括 文本 、 音 频 、 图 像 、 
形 、 动 画 和 视频 ， 这 些 统称 为 感知 媒体 ， 感 知 媒体 有 其 特有 的 性 质 。 


1.5.1 文本 


文本 是 用 的 最 多 的 一 种 符号 媒体 形式 ， 是 最 简单 的 数据 类 型 ， 其 占用 的 存储 空间 最 少 。 

文本 数据 类 型 在 数据 库 中 可 为 字段 ， 可 以 被 索引 、 搜 索 及 分 类 。 事 实 上 ， 文 本 是 关系 数 
据 库 的 基本 元 素 。 文 本 字段 被 用 于 姓名 、 地 址 、 描 述 、 定 义 和 各 类 数据 属性 。 

文本 也 是 文档 的 基本 构成 。 一 个 电子 邮件 消息 几乎 毫 无 例外 地 由 一 些 文本 字段 组 成 ， 如 
收 信人 的 姓名 和 地 址 、 发 信人 的 姓名 和 地 址 等 。 文 本 的 主要 属性 包括 段落 风格 、 字 符 风格 (如 
黑体 、 宋 体 、 斜 体 等 )、 文 字 种 类 和 大 小 ， a 相对 位 置 。 

超 文本 是 索引 文本 的 一 个 应 用 ， 它 能 在 - wr a 超 
文本 是 超 媒 体 文档 不 可 缺少 的 部 件 。 从 多 媒体 应 用 天 超 媒体 文档 是 基本 的 复合 对 象 
ty 声音 和 全 运动 视频 。 超 媒体 文档 几乎 

的 了 对 象 



































总 是 含有 文本 ， 或 许 再 有 一 个 或 多 个 其 他 类 
1.5.2 ”音频 RN 


、 
语音 和 音频 对 象 包括 音乐 ,] 区 各 亲人 a pa stn 
间 维 。 了 
一 个 音频 对 象 需要 存 福 与 声音 片断 有 关 的 信 ,和 声音 片 业 的 长 度 、 压缩 算法 、 回 放 特 
性 ， 导电 有 二 送 些 注释 必须 作为 释 加 内 容 与 原始 片断 同时 播放 。 
此 可 见 ; 程 性 ， 适 合 在 个 时 间 段 中 表现 。 可 以 这 样 说 ， 没 有 时 间 也 就 没 
有 声音 。 由 于 时 间 性 ， 声 音 数据 具有 很 强 的 前 后 相关 性 ， 数 据 量 相对 于 文本 而 言 要 大 得 多 
实时 性 要 求 也 比较 高 。 因 为 声音 是 连续 的 ， 所 以 又 称 之 为 连续 型 时 基 媒 体 类 型 。 


1.5.3 图 像 


什么 是 图 像 ? “图 (Picture)” 是 指 用 于 描绘 或 用 摄影 等 方法 得 到 的 景物 的 相似 物 ;“ 像 
(Image)” 是 指 直接 或 间接 得 到 的 人 或 物 的 视觉 印象 。 可 以 这 样 认为 ， 凡 是 能 为 人 类 视觉 系统 
所 感知 的 信息 形式 或 人 们 心目 中 的 有 形 想象 统称 为 图 像 。 这 样 ， 无 论 是 图 形 ， 还 是 文字 影像 
视频 等 最 终 都 是 以 图 像 形式 出 现 的 。 

像 对 象 是 超 媒体 文档 对 象 的 子 对 象 ， 是 除 代码 文 本 (如 ASCII 文本 ) 和 与 时 间 相 关 数 据 
( 即 随时 间 改 变 而 变化 的 数据 ) 之 外 的 所 有 数据 形式 , 即 所 有 图 像 对 象 都 以 图 形 或 编码 的 形式 表 
现 。 因 此 ， 图 像 对 象 包括 的 数据 类 型 有 文档 图 像 、 分 形 位 图 、 元 文件 和 静止 画面 等 。 

到 像 对 象 包括 3 种 类 型 : 抽象 图 像 、 不 可 视图 像 和 可 视图 像 。 

(1) 抽象 图 像 实际 上 并 不 是 那些 存在 于 真实 世界 中 的 对 象 的 图 像 或 显示 , 而 是 基于 一 些 算 
术 运 算 的 计算 机 生成 的 图 像 。 分 形 是 这 类 图 像 的 一 个 极 好 例子 ， 绝 大 多 数 分 形 是 由 计算 机 的 
算法 生成 的 ， 这 些 算法 试图 显示 它们 可 以 生成 的 各 种 不 同 模式 组 合 ， 就 像 一 个 万 花 简 可 以 显 
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示 各 种 图 形 是 由 于 万 花 简 转 动 时 玻璃 珠 相对 位 置 不 同 而 产生 的 。 


离散 函数 可 产生 在 时 
似 于 这 样 的 操作 


时 间 


CO) 不 


温度 
摄影 
形式 
摄像 
都 要 


算法 




















内 云彩 的 形变 。 


























间 尺 度 上 保持 不 变 的 静止 图 像 。 连 续 函数 用 于 显示 动画 的 图 像 及 类 
一 幅 图 像 隐 退 或 溶 于 其 他 的 图 像 。 这 一 技术 已 用 于 显示 某 些 过程 ， 如 一 段 












































视 的 图 像 是 那些 不 作为 图 像 存储 但 作为 图 像 显 示 的 图 像 。 这 些 图 像 包 括 气压 计 、 














计 及 其 他 度量 的 显示 。 




















(3) 可 视图 像 有 各 类 图 片 (如 蓝图 、 工 程 图 等 )、 文 档 图像 ( 如 一 页 书 作为 图 像 扫描 得 来 的 )、 






























































照片 (如 扫描 的 ， 或 直接 用 数码 照相 机 拍摄 的 )、 画 (如 由 计算 机 绘图 软件 生成 的 ， 或 扫描 
的 ) 及 由 数字 摄像 机 捕获 的 静止 帧 。 所 有 这 些 情形 中 ， 图 像 都 在 一 定 的 时 间 间 隔 内 以 完整 位 图 
存在 ， 位 图 中 包括 由 输入 装置 捕获 的 每 个 像素 。 所 有 输入 装置 ， 不 论 它 们 是 扫描 仪 还 是 
机 ， 都 用 扫描 的 方法 来 获取 预先 定义 的 坐标 格 中 像素 的 颜色 和 强度 。 几 乎 每 种 情况 下 ， 
使 用 某 种 类 型 的 压缩 方法 来 减少 图 像 的 整体 容量 。 























图 像 内 容 外 ， 还 有 必要 存储 < Al, 包括 使 用 的 压缩 





从 了 存储 以 压缩 形式 存在 的 


























除 
类 型 ， 以 便 使 图 像 可 在 目标 工作 站 上 成 功 地 解压 缩 。 SN 
对 于 多 媒体 系统 ， 压 缩 算法 取决 于 图 像 的 类 型 和 来 源 。 从 扫描 仪 中 扫描 来 的 图 像 可 有 









































CCITT Group4 格式 存储 , 而 用 视频 摄像 机 捕获 的 可 用 JPEG 格式 存储 。 作 为 通用 的 规则 ， 


关于 


研究 ; 


1.5.4 


述 数 





压缩 方法 的 信 

















图 形 
2 


。 图形 


人 


据 的 每 一 点 六 而 是 描述 产 














须 是 图 像 文 件 的 组 成 刘 Ne 是 很 重要 的 。 
图 像 除 采集 、 存 储 以 外 还 有 处 理 、 传 递 输 
图 像 数据 压缩 、 优 化 、 倘 本 及格 图 像 的 处 理 是 一 个 十 分 复杂 的 问题 ， 也 是 目前 


复杂 的 过 程 。 就 图 像 处 理 而 言 ， 就 包含 有 


Xs 


WX 


0 
NY 
是 对 图 像 依据 某 个 标准 进行 分 析 而 产生 的 结 结果 。 它 不 直接 描 
生 这 些 点 的 过 程 及 方法 。 图 形 具有 如 下 特性 。 


(1) 图 形 是 对 图 像 进 行 抽象 的 结果 ， 即 用 图 形 指令 取代 了 原始 图 像 ， 去 掉 不 相关 的 信息 


即 在 





格式 上 做 了 一 次 变换 。 











(2) 图 形 的 矢量 化 使 得 有 可 能 对 图 中 的 各 个 部 分 分 别 进行 控制 。 
(3) 图 形 的 产生 需要 计算 时 间 。 
































通常 将 图 形 分 为 二 维 图 形 











三 维 图 形 两 大 类 。 平 面 图 形 就 是 二 维 图 形 ， 它 的 变换 都 是 在 











空间 中 进行 的 。 三 维 图 形 要 实现 的 是 三 维 空间 的 图 形 显示 与 变换 。 例 如 ， 在 虚拟 现实 、 








门 的 研究 课题 。 
2. 图 像 























地 图 、 计 算 机 辅助 设计 中 需要 广泛 应 用 三 维 图 形 。 三 维 图 形 及 真实 感 图 形 的 生成 需要 花 
计算 时 间 和 空间 。 物 体 可 视 化 、 过 程 造 型 及 成 像 技 术 、 整 体 光 照 效果 等 技术 ， 都 是 目 








图 形 与 图 像 是 两 个 不 同 的 概念 ， 其 主要 区 别 如 下 。 





(1) 图 形 是 矢量 的 概念 ， 它 的 基本 元 素 是 图 元 ， 如 线 、 点 、 面 等 元 素 ; 而 图 像 是 位 图 的 概 











， 它 的 基本 元 素 是 像素 ;像素 是 把 一 幅 位 图 图 像 考虑 为 一 个 矩阵 ， 和 矩阵 中 的 任 一 元 素 对 应 





像 中 的 一 个 点 。 因 此 ， 图 像 显示 得 要 逼真 些 。 








1 章 . 有 
- 辣 


一 用 天 条 我 及 让 其 庙 用 (第 2 县 ) 








-一 @) 图 形 可 以 进行 变换 而 不 失真 ， 而 图 像 经 过 变换 也 许 会 失真 。 











(3) 图 形 可 以 以 图 元 为 单元 单独 进行 属性 修改 、 编辑 等 操作 ， 而 图 像 则 不 行 ， 它 只 能 对 像 
素 或 图 像 块 进行 处 理 ， 这 是 由 于 在 图 像 中 并 没有 关于 图 像 内 容 的 独立 单位 的 缘故 。 

(4) 图 形 的 显示 过 程 是 依据 图 元 的 顺序 进行 的 , 而 图 像 的 显示 过 程 是 按照 位 图 中 所 安排 的 
像素 进行 的 ， 它 与 图 像 内 容 无 关 。 


1.5.5 动画 


动画 可 以 认为 是 运动 的 图 画 。 计 算 机 动画 就 是 利用 计算 机 生成 一 系列 可 供 实时 演播 的 画 
面 的 技术 。 它 可 辅助 传统 卡通 动画 片 的 制作 ， 也 可 通过 对 三 维 空间 中 虚拟 摄像 机 、 光 源 及 物 
体 运 动 和 变化 的 描述 ， 逼 真 地 模拟 客观 世界 中 真实 或 虚构 的 三 维 场景 随时 间 而 演变 的 过 程 。 
由 计算 机 生成 的 一 系列 画面 可 在 显示 屏 上 动态 演示 ， 也 可 将 它们 记录 在 电影 胶片 上 或 转换 成 
视频 信息 输出 到 录像 带 上 。 动 画 具 有 如 下 特点 。 To 

(1) 时 间 连 续 性 。 即 动态 帧 构成 的 图 像 具 有 时 间 连 续 性 。 AN 是 一 帧 帧 地 送 到 屏幕 的 ， 
故 动画 序列 属于 离散 型 时 基 媒体 类 型 。 \《 

(2) 数据 量 大 。 必 须 采用 合适 的 压缩 方法 才 外 上 “oi 

(3) 相关 性 。 即 动态 图 像 的 帧 与 帧 之 A aia 

(4) 对 实时 性 的 要 求 高 。 在 规定 时 间 内 sg 更 换 面 面 播放 的 过 各 以 使 被 观看 的 动 
态 图 像 具 有 连续 性 。 SO 、 显 示 速 度 、 数 据 读 取 速度 都 要 满足 实时 性 
的 要 求 。 
ot 简单 的 分 类 方法 是 将 其 区 分 为 计算 机 辅助 动 
画 和 模型 动画 (又 称 三 维 计算 机 动 1 re 造 
型 动画 是 对 每 一 个 活动 的 象 分 别 进行 设计 赋 象 一 些 特征 (如 形状 、 大 小 、 颜 色 等 )， 
然后 用 这 些 对 象 组 成 完整 的 画面 。 这 些 对 象 在 设计 要 求 下 实时 变换 ， 最 后 形成 连续 的 动画 过 
程 。 帧 动画 是 二 幅 先 续 的 画面 组 成 的 图 还 或 图 像 序列 ， 这 是 产生 各 种 动画 的 基本 方法 。 

二 维 动画 与 4 动画 是 不 相同 的 。 当 计算 机 制作 的 动画 画面 仅 是 二 维 的 透视 效果 时 ， 就 
是 二 维 动画 。 如果 通 过 CAD 形式 创作 出 具有 立体 形象 的 画面 就 是 三 维 动画 。 如 果 再 使 其 具有 
真实 的 光照 效果 和 质感 ， 就 是 三 维 真实 感动 画 。 通 常 ， 二 维 动画 可 由 计算 机 实时 变换 生成 并 
演播 , 但 三 维 动画 尤其 三 维 真 实感 动画 由 于 计算 量 太 大 ， 只 能 先生 成 连续 的 帧 图 像 画面 序列 ， 
在 播放 时 ， 调 用 该 图 像 序列 演播 即 可 ， 有 明显 的 生成 和 播放 的 不 同 过 程 。 动 画 的 播放 常常 要 
与 声音 配合 进行 ， 其 操作 有 播放 、 暂 停 、 退 回 、 逐 帧 、 跳 到 特定 帧 、 反 向 、 快 进 、 快 退 等 。 
因此 ， 从 媒体 处 理 角度 来 看 ， 动 画 是 具有 连续 时 间 特 性 的 、 以 节 段 为 单位 的 媒体 形式 。 节 段 
可 以 是 帧 ， 也 可 以 是 一 个 帧 组 。 由 于 压缩 的 需要 ， 常 常 不 以 帧 为 单位 ， 而 采用 10 帧 左右 为 一 
组 的 节 段 来 处 理 ， 而 声音 就 按 节 段 来 进行 同步 。 













































































































































































1.5.6 ”视频 


视频 是 影像 视频 的 简称 ， 大 多 数 用 于 与 电视 、 图 像 处 理 有 关 的 技术 中 。 与 动画 一 样 ， 视 
频 是 由 连续 的 随 着 时 间 变 化 的 一 组 图 像 (或 称 画面 ) 组 成 。 视频 信号 是 连续 的 、 随 着 时 间 变 化 的 
一 组 图 像 。 只 是 画面 图 像 是 自然 景物 的 图 像 ， 因 为 在 计算 机 中 使 用 ， 所 以 就 必须 是 全 数字 化 
的 ， 但 在 处 理 过 程 中 免不了 受到 电视 技术 的 各 种 影响 。 
电视 主要 有 3 大 制式 即 NTSC、PAL、SECAM 3 种。 德国、 英国 等 一 些 西欧 国家 ， 新 加 
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坡 、 中 国 、 澳 大 利 亚 、 新 西 兰 等 国家 和 地 区 采用 PAL 制式 ， 美 国 、 日 本 、 中 国 台湾 地 区 、 韩 
等 国家 和 地 区 采用 NTSC 制式 ,而 采用 SECAM 制 的 国家 主要 为 大 部 分 独 联 体 国 家 (如 俄 
斯 )、 法 国 、 埃 及 ， 以 及 非洲 的 一 些 法 语系 国家 和 地 区 。PAL 制 是 德国 研制 的 ， 为 625 线 的 扫 
描 线 数 ，50Hz 频率 下 ， 每 秒 25 帧 。NTSC 是 美国 研制 的 一 种 兼容 彩电 制式 ，60Hz 频率 下 
每 秒 30 帧 。SECAM 是 法 国人 提出 的 ， 帧 频 每 秒 25 帧 。 因 此 ， 当 计算 机 对 其 进行 数字 化 时 ， 
就 必须 在 规定 的 时 间 内 (如 1/30s 内 ) 完 成 量化 、 压 缩 和 存储 等 多 项 工作 。 反 过 来 ， 将 计算 机 画 
面 送 上 电视 ， 会 由 于 扫描 线 的 不 同 而 出 现 有 一 带 状 区 域 无 显示 的 情况 。 
动态 视频 对 颜色 空间 的 表示 有 多 种 情况 ,最 常见 的 是 红 、 绿 、 蓝 (R、G、B) 三 维 彩 色 空 间 。 
也 有 其 他 彩色 空间 表示 ， 如 亮度 、 色 度 、 色 度 (Y、U、V) 等 。 
对 于 动态 视频 的 操作 和 处 理 ， 除 了 播放 过 程 的 动作 与 动画 相同 外 ， 还 可 以 增加 特技 效果 ， 
如 淡 入 淡出 、 化 入 化 出 、 复 制 、 镜 像 等 ， 用 于 增加 表现 力 ， 但 在 媒体 中 属于 媒体 表现 属性 的 
容 。 与 动画 类 同 ， 视 频 序列 也 是 由 节 段 构成 的 。 hs mei ee 
则 要 求 能 双向 运行 ， 所 以 关键 帧 就 可 以 作为 随机 访问 操作 的 般 是 10 一 15 帧 为 一 个 单 
位 。 播 放 的 方向 取决 于 压缩 时 对 帧 序 的 处 理 方式 ， 若 有 明显 前 1 后 帧 压缩 关系 ， 则 只 能 单 向 
播放 ; 若 压 缩 时 只 有 由 压缩 而 无 由 问 压缩 ， 则 一 般 责 名 四 有 播放 。 
国际 电信 联盟 (TU) 提 出 的 未 来 通信 的 目标 是 > 在 世界 的 任何 地 方 任何 时 候 ， 通 过 任何 
媒体 ， 用 可 以 接受 的 成 本 ， 使 人 与 人 、 A 狂 机 器 和 机 器 均 可 以 方便 和 安全 地 互相 通信 ， 
SN 一 些 关键 性 问题 还 有 待 解决 。 


1.6 oe 与 发 展 的 势 


近年 来 ， sna 产品 更 新 换代 的 周期 很 得。 多 
名人 技术 几乎 要 六 了 计算 机 应 用 的 绝 大 多 妆 太 、 进入 了 社会 生活 的 各 个 方面 。 


1.6.1 多 媒体 接 术 的 应 用 概况 


首先 ， 多 媒体 技术 改善 了 人 类 操作 计算 机 的 人 机 界面 。 其 次 ， 从 信息 处 理 的 角度 看 ， 多 
媒体 技术 为 信息 的 表达 和 处 理 提供 了 全 新 的 方式 。 多 媒体 信息 的 大 量 使 用 显著 地 改变 计算 机 
所 支持 的 人 与 人 之 间 的 交互 方式 ， 使 之 达到 一 个 更 高 的 水 平 ， 如 自动 语言 翻译 、 自 动 语音 咨 
询 和 自动 图 像 识 别 等 。 多 媒体 技术 为 信息 处 理 提供 了 更 广阔 的 舞台 。 另 外 ， 多 媒体 技术 缩短 
了 人 类 传递 信息 的 路 径 。 信 息 的 巨大 物化 力量 主要 表现 在 信息 的 共享 特性 上 。 当 人 们 真正 认 
识 到 信息 共享 是 开展 信息 技术 研究 的 首要 任务 之 后 ， 就 必须 研究 和 探索 什么 是 表示 、 传 送 和 
处 理 信息 的 较 好 途径 。 比 较 理想 的 途径 应 是 能 较 完整 地 表示 概念 、 能 较 迅速 地 传递 概念 、 能 
以 符合 人 类 认 知 过 程 的 方式 加 工 概念 的 方法 ， 从 而 使 得 完成 某 个 智力 任务 的 过 程 得 到 较 大 的 
改善 。 多 媒体 正 是 利用 各 种 信息 媒体 形式 ， 集 成 地 用 声 、 图 和 文 等 来 承载 信息 ， 这 就 缩短 了 
信息 传递 的 路 径 。 

最 后 ， 多 媒体 技术 促进 了 传统 视听 技术 的 发 展 。 传 统 的 视听 电器 技术 是 多 媒体 技术 的 一 
重要 基础 ， 反 过 来 ， 多 媒体 技术 的 发 展 ， 也 为 家 用 电器 工业 注入 了 新 的 活力 。 

目前 多 媒体 系统 已 进入 了 实用 阶段 ， 它 被 广泛 应 用 于 工业 生产 管理 、 学 校 教育 、 公 共 信 
息 咨询 、 商 业 广 告 、 军 事 指挥 与 训练 甚至 家 庭 生活 与 娱乐 等 领域 。 因 此 ， 多 媒体 技术 被 认为 
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1 章 . 有... 
-WO 


区 巡 休 技 坟 发 其 应 用 (第 之 腑 ) 


一 是 信息 领域 的 又 一 次 革命 。 


i 


1. 教育 培训 


众所周知 ， 通 过 对 人 体 多 种 感官 的 刺激 ， 更 能 加 深入 们 对 新 鲜 事 物 的 印象 ， 取 得 更 好 的 
学 习 效果 。 多 媒体 系统 的 形象 化 和 交互 性 可 为 学 习 者 提供 全 新 的 学 习 方 式 ， 使 接受 教育 和 培 
训 的 人 能 够 主动 地 创造 性 地 学 习 ， 具 有 更 高 的 效率 。 传 统 的 教育 和 培训 模式 通常 是 听 教 师 讲 
课 或 者 自学 ， 两 者 都 有 其 自身 的 不 足 之 处 。 多 媒体 的 交互 教学 改变 了 传统 的 教学 模式 ， 不 仅 
教材 丰富 生动 、 教 育 形 式 灵活 ， 而 且 有 真实 感 ， 更 能 激发 人 们 学 习 的 积极 性 。 

教育 领域 是 多 媒体 技术 重要 的 、 具 有 发 展 前 途 的 应 用 领域 之 一 。 随 着 多 媒体 技术 进入 教 
育 领域 ， 教 育 工作 者 长 期 追求 的 “ 寅 教 于 乐 ”的 理想 正在 逐步 变 为 现实 。 

2. 信息 服务 


在 旅游 、 邮 电 、 医 院 、 交 通 、 商 业 、 博 物 馆 和 宾馆 等 公共 活 疡 各 场所， 通过 多 媒体 技术 
可 以 提供 高 效 的 咨询 、 展 示 服 务 。 在 销售 、 宣 传 等 活动 中 ,使 用 多 媒体 技术 能 够 图 文 并 基地 
展示 产品 ， 全 客户 对 商品 能 够 有 一 个 感性 直观 的 认识 

3， 电 子 出 版 物 


电子 出 版 物 是 以 数字 代码 方式 将 图 、 文 ,| 声 、 光 、 电 介质 上 ， 通 过 
计算 机 或 类 似 的 设备 阅读 使 用 ， 并 i 其 内 容 可 分 为 电子 图 书 、 文 
档 资料 、 报 刊 杂 志 、 娱 乐 游戏 、 宣传 广告 和 简报 等 。 多 媒体 电子 出 版 物 是 计算 机 多 媒体 技术 
与 文化 、 艺术 、 教育 等 和 学 神 突 洽 的 产物 。 清和 做 央 和 队 本 六 
式 不 同 外 ， 更 重要 的 是 它 具 有 集 成 性 、 交互 性 等 特点 点 只 可 以 配 有 声音 解 三 维 动画 
和 彩色 图 像 ， 再 加 - 上 超 文本 技术 94 应用， 使 它 A 信息 检索 灵活 方便 ， 人 
更 有 效 的 获取 知识 、 和 的 放流 和 输入 BRYA 
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4 eat) 户 千 设计 ~ 

多 媒体 技术 为 从 事 音 乐 、 美 术 创 作 的 人 提供 了 强 有 力 的 工具 。 居 室 装 修 设计 人 员 通 过 多 
媒体 计算 机 和 设计 软件 ， 制 作出 各 种 立体 、 允 真 的 装修 效果 。 光 盘 出 版 物 中 收集 了 大 量 的 音 
乐 片断 、 艺 术 剪贴 、 图 形 和 商标 等 ， 为 不 懂 艺 术 的 人 准备 了 创作 素材 。MIDI 接口 和 音乐 合成 
功能 使 音乐 创作 更 加 方便 快捷 。 影 视 节目 的 后 期 制作 也 是 多 媒体 技术 的 重要 应 用 ， 在 电影 、 电 
视 的 创作 中 已 经 成 为 必 不 可 少 的 一 步 。 应 用 多 媒体 技术 ， 可 以 制作 影视 特技 画面 ， 如 中 国 首 
部 武侠 动漫 系列 剧 《 秦 时 明月 》 中 诸 子 百 家 、 墨 家 机 关 城 等 许多 精彩 镜头 都 是 计算 机 制作 的 。 

5. 娱乐 


计算 机 刚 出 现时 ， 人 们 对 它 的 要 求 是 数学 运算 和 逻辑 判断 ， 后 来 发 现 还 能 利用 计算 机 玩 
游戏 。 为 了 让 计算 机 上 的 游戏 更 加 形象 ， 能 发 出 各 种 声音 ， 产 生 了 音频 卡 。 随 着 多 媒体 技术 
的 不 断 发 展 ， 伴 随 着 娱乐 的 要 求 ， 多 媒体 信息 家 电 是 多 媒体 应 用 中 的 一 个 很 大 的 领域 。 多 媒 
体 计算 机 使 电视 机 、 激 光 唱 机 、 影 碟 机 和 游戏 机 合 为 一 体 ， 逐 渐 成 为 一 个 现代 的 高 档 家 用 电 
器 。 旅游、 娱乐 界 正 希 望 利用 虚拟 现实 技术 使 观众 有 亲临 现场 之 感 。 利 用 多 媒体 交互 性 特点 ， 
也 可 以 制作 交互 电视 ， 让 观众 进入 角色 ， 控 制 故事 的 不 同 结局 ， 增 加 悬念 和 好 奇 感 。 体 感 游 
戏 、 网 络 游戏 也 将 成 为 游戏 的 主流 。 
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6. 多 媒体 通信 和 协同 工作 
归 到 多 媒体 的 真正 本 质 即 多 形式 的 信息 互动 交流 ， 那 么 多 媒体 的 应 用 领域 肯定 包括 通 
信 。 以 上 的 多 媒体 应 用 都 是 人 和 计算 机 之 间 的 信息 交流 ， 在 人 际 信息 交流 中 ， 多 媒体 应 用 也 
极为 重要 。 一 方面 ， 不 同 的 交流 形式 适合 不 同 内 容 的 信息 ， 而 多 种 信息 交流 形式 的 相互 补充 ， 
又 能 增加 信息 交流 的 有 效 性 。 当 前 计算 机 网 络 已 在 人 类 社会 进步 中 起 到 了 重大 的 作用 。 随 着 
多 媒体 技术 的 发 展 和 “信息 高 速 公路 ”的 开通 ， 包 括 声 、 文 、 图 在 内 的 多 媒体 邮件 更 受用 户 
欢迎 。 在 此 基础 上 发 展 起 来 的 可 视 电 话 、 视 频 会 议 系统 将 为 人 类 提供 更 全 面 的 信息 服务 。 网 
络 多 媒体 有 着 广阔 的 应 用 前 景 。 目 前 已 经 开通 了 大 量 的 远程 教育 系统 ， 各 大 学 纷纷 开展 了 远 
程 教育 。 异 地 的 学 员 可 以 实时 地 听取 老师 的 讲课 ， 并 随时 提问 ， 教 师 也 可 以 实时 地 了 解 远 在 
千里 之 外 的 学 生 的 反映 。 出 差 在 不 同城 市 的 同事 ， 可 以 通过 计算 机 支持 的 协同 工作 (Computer 
Supported Collaborative Work，CSCW) 系 统 讨 论 、 修 改 一 个 大 楼 的 设计 方案 ， 可 以 就 同一 份 图 
二 让、 公 天 于 可 届 曙 到 于 太 光 全 于 拘 ， 拓 训 攻 全 和， 必 仙 册 0 六 
一 样 。 偏 远 的 乡村 可 以 通过 远程 医疗 系统 ， 享 受到 城市 知 诊治 。 医 生 可 以 通过 多 媒 
体系 统 与 病人 面对面 地 交谈 ， 观看 病人 的 CT、 心 电 图 检查 结果 ， 进 行 远程 咨询 和 检 
查 ， 从 而 进行 远程 会 诊 ， 甚至 在 远程 专家 指导 下 进行 jos， 将 医院 与 医院 之 间 ， 甚 至 
国 与 国之 间 的 医疗 系统 建立 信息 通道 ， 实 现 攻 人 


7， 模 拟 训练 


利用 多 媒体 技术 丰富 eat am 研究 人 员 能 够 设计 出 逼真 的 仿真 训练 
系统 ， 如 飞行 模拟 训练 、 航海 模拟 训 训练 需要 水 在 :计算 机 前 操作 模拟 设备 ， 就 可 
得 到 如 同 操作 实际 设备 一 般 的 效果 。 不 仅 能 够 有 vt 练 经 费 ， 缩 短 训 练 时 间 ， 也 能 够 
避免 一 些 不 必要 的 损失 。 许多 军用 和 民用 UR 载 人 航天 器 在 飞 上 太空 之 前 都 做 过 许 
多 模拟 飞行 。 ee 业 性 海事 官员 培训 学 校 ， 由 计算 机 控制 的 

油轮 的 操作 及 集装箱 船只 的 复杂 装卸 过 程 。 


i 
1.6.2 ”多 媒体 技术 的 发 展 趋势 


多 媒体 技术 正 使 信息 的 存储 、 管 理 和 传输 的 方式 产生 根本 性 的 变化 ， 它 影响 到 相关 的 每 
一 个 行业 ， 同 时 也 产生 了 一 些 新 的 信息 行业 。 因 此 ， 多 媒体 技术 的 发 展 很 可 能 是 不 拘 一 格 、 
多 种 多 样 的 。 综 合 起 来 未 来 可 以 在 以 下 4 个 方面 得 以 迅速 发 展 。 

1. 计算 机 的 多 媒体 化 


多 媒体 信息 处 理 逐 步 成 为 计算 机 体系 结构 中 不 可 分 割 的 一 部 分 。 现 在 的 多 媒体 计算 机 主 
要 以 个 人 计算 机 为 平台 。 今 后 的 发 展 ， 据 许多 专家 推测 包括 两 个 方向 : 一 是 与 家 用 计算 机 村 
结合 ， 使 计算 机 进入 家 电 市 场 ， 以 至 最 后 能 取代 电视 机 ;一 是 向 高 档 发 展 ， 多 媒体 技术 正在 
进入 多 种 工作 站 ， 如 DVI 技术 已 经 移植 在 SUN 工作 站 上 。Microsoft 公司 的 创始 人 ， 前 任 董 
友 长 和 首席 执行 官 比尔 。 盖 茨 提 出 了 一 个 分 阶段 的 方法 。 第 一 阶段 应 用 计算 机 ， 第 二 阶段 的 
EH 算 机 将 能 与 电视 机 相 竞 争 , 从 而 蔡 代 电视 机 , 不 过 它 需 要 有 全 运动 的 电视 图 像 。 目前 的 Intel 
司 的 DVI 技术 已 实现 了 这 一 功能 。 但 DVI 技术 还 得 降低 成 本 和 提高 质量 才能 与 电视 机 相 竞 
。 对 于 MPC, 从 实质 上 看 , 它 主要 是 通过 多 媒体 技术 使 计算 机 与 CD-ROM 相 结 合 . CD-ROM 
可 存储 各 种 音响 、 视 频 、 电 子 出 版 物 和 游戏 程序 ， 从 而 使 MPC 成 为 家 庭 中 集 娱乐 、 教 育 和 
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1 意 加 ... 


区 巡 体 技术 发 其 应 用 (第 之 腑 ) 





游戏 于 一 体 的 系统 。 人 们 将 不 必 浪 费 钱财 买 学 习 机 、 游 戏 机 、 电 子 琴 、 手 风琴 、 钢 琴 、 电 唱 




















机 、 电 视 机 等 ， 用 最 小 的 代价 获得 令 人 满意 的 、 实 惠 的 、 全 新 的 享受 。 

2. 音响 和 视频 系统 的 智能 化 

将 一 个 交互 式 CD-ROM 的 放 像 系统 与 电视 机 相连 接 ， 把 它 作 为 一 个 CD-ROM 放 像 机 ， 
而 不 是 作为 一 台 计 算 机 。 这 样 把 音响 、 视 频 设备 与 多 媒体 技术 相 结合 将 大 幅度 提高 它们 的 性 
能 。 例 如 ， 采 用 MPEG 标准 算法 的 视频 图 像 实时 解压 缩 处 理 器 使 CD-ROM 可 存储 经 过 压缩 
的 信息 ， 从 而 使 容量 提高 几 百 倍 到 上 千 倍 ， 甚 至 更 高 。 

3， 数字 通信 网 络 化 

通信 是 社会 赖 以 存在 和 发 展 的 基础 ， 是 社会 生产 的 基本 条 件 。 社 会 进步 和 社会 生产 发 展 
的 水 平 在 很 大 程度 上 受制 于 通信 水 平 的 发 展 。 
过 去 通信 主要 是 单 媒体 的 通信 ， 如 传真 通信 、 语 音 A 0 世纪 90 年 代 后 ， 多 
媒体 通信 取代 单 媒体 通信 的 呼声 越 来 越 高 。 在 网 络 A 言 息 是 当前 世界 热门 的 
开发 课题 。 从 目前 的 多 媒体 开发 来 看 ， 推 动 数字 通信 ee 人 名 功能 强 
























































大 而 又 经 济 的 多 媒体 计算 机 系统 取得 了 很 大 进展 ， jee hate 
管理 能 力 。@ 大 容量 和 高 性 能 的 存储 器 取得 和 大 进 展 上 -并且 价格 又 在 下 降 。 @ 高 速 的 综合 

务 数字 网 络 的 进展 ,尤其 是 宽带 ISDN 标准 前 0 we 
Mode，ATM) 相 关 技 术 的 快速 发 展 ， - 是 立 了 ATM 协会 ， 全 世界 已 有 近 300 个 计算 机 
通信 和 领域 中 的 厂商 加 入 了 这 个 协会 >4 3G/4G 通信 技术 处 - 泛 应 用 ， 越 来 越 多 的 多 媒体 应 
通过 手机 等 移动 通信 工具 得 以 实现 、 

随 着 科学 技术 的 迅速 发 展 ; 当前 世界 经 er 区 经 济 转向 知识 型 和 信息 型 经 济 ， 
通信 的 重要 性 更 为 突出 。 各 之 社会 分 工 越 来 越 人 之 间 ， 单 位 与 单位 之 间 ， 企 业 与 企 
ee 紧密 。 很 多 问题 ， 如 行政 理 、 工程 设计 、 生 产 调度 、 报 表 编 制 、 书 
| 编写 等 往往 需 和 王位 于 不 同 区 域 、 属 于 不 同行 业 的 个 人 或 单位 共同 讨论 和 决策 。 在 这 
种 情况 下 ， 传 统 的 ae 网 络 化 结构 。 因 此 ， 综 合 业务 数字 网 就 越 来 越 受 到 人 们 





法 

































的 重视 。 把 多 媒体 技术 与 广播 电视 及 通信 ， 特 别 是 与 综合 业务 数字 网 结合 起 来 ， 使 传统 的 无 
线 通 信和 数据 通信 之 间 的 界线 逐渐 消失 ， 最 终 计算 机 、 通 信 、 大 众 传媒 势必 趋同 ， 走 向 融合 。 


分 布 式 多 媒体 技术 与 系统 的 实用 化 


分 布 式 多 媒体 技术 是 多 媒体 信息 处 理 、 网 络 技术 及 分 布 式 计算 技术 结合 的 产物 ， 它 将 为 
人 们 提供 全 新 的 信息 服务 ， 其 中 包括 多 媒体 电子 邮件 、 实 时 电视 会 议 、 计 算 机 支持 的 协同 工 
作 、 远 程 学 习 、 电 子 报刊 出 版 和 虚拟 现实 等 。 这 极 大 地 扩大 了 多 媒体 技术 的 应 用 领域 。 
从 多 媒体 技术 本 身 的 发 展 来 看 ， 全 数字 化 是 必由之路 (荷兰 政府 已 于 2006 年 在 全 国 全 
实现 了 数字 化 电视 )。 因 为 只 有 这 样 才能 真正 对 多 媒体 信息 进行 交互 控制 ， 才 能 在 多 媒体 信 
之 间 建 立 逻 辑 联系 ， 融 为 一 个 整体 。 当 前 全 数字 化 的 代表 是 DVI 技术 ， 其 他 系统 也 正 向 数字 
化 发 展 。 
可 以 预见 ， 多 媒体 技术 在 以 上 各 方面 将 会 取得 迅速 发 展 ， 在 不 久 的 将 来 ， 多 媒体 将 普及 
到 人 们 工作 、 生 活 的 方方面面 ， 人 们 可 以 使 用 多 媒体 计算 机 系统 作为 终端 设备 ， 通 过 网 络 举 
行 可 视 电 话 会 议 、 视 频 会 议 、 治 谈 生 意 、 进 行 娱乐 和 接受 教育 等 。 多 媒体 技术 将 在 中 国医 疗 、 
水 利 、 交 通 、 海 洋 、 远 程 监控 等 领域 中 得 到 应 用 ， 并 且 “ 人 机 交互 大 学 课程 ”将 会 进入 实 























































































































人。 
各 这 技术 梳 冯 | 区 








人 们 的 工作 方式 、 生 活 方式 、 学 习 方 式 将 会 产生 深刻 的 变革 。 





1.7 小 结 


本 章 首先 对 数据 、 信 息 、 媒 体 、 多 媒体 、 多 媒体 系统 等 一 一 做 了 介绍 ， 然 后 分 别 对 音频 、 
图 像 、 图 形 、 动 画 和 视频 等 对 象 进行 了 定义 ， 并 引出 了 多 媒体 系统 的 若干 技术 ， 力 图 给 读者 
一 个 较为 完整 的 概念 ， 使 读者 掌握 多 媒体 系统 的 基本 配置 ， 了 解 多 媒体 的 应 用 及 所 涉及 的 若 
干 技术 。 最 后 ， 还 对 多 媒体 技术 的 研究 范围 与 要 实现 的 目标 进行 了 阐述 ， 从 而 使 读者 对 多 媒 
体 技 术 有 一 个 较为 全 面 的 了 解 。 












































1.8 习 题 4 
了 论 
1。 填 空 是 < 
(1) 根据 ISO 的 定义 ， 和 。 
(2) 一 般 用 计算 机 实现 的 动画 有 造型 动画 和 帧 动画 两 种 .造型 动画 是 对 每 一 个 活动 的 对 象 























分 别 进行 设计 ， 赋 了 予 每 个 对 象 一 4 SR 关 小 、 颜 色 等 )， 然 后 用 这 些 对 象 组 成 完整 


的 。 这 些 对 象 在 设计 要 求 下 实时 全， 全 一 ， 最 后 形成 动画 过 程 。 帧 动画 是 由 
一 幅 组 成 的 图 形 或 图 像 ~ 这 是 产生 各 种 动画 的 基本 方法 。 
(3) 多 媒体 技术 的 发 展 很 可能 是 不 拘 一 格 、 多 种 多 样 的 。 综 合 起 来 可 以 分 为 4 个 广 
> rr "DX 














面 : 、 、 A 


(0 多 媒体 技术 的 目标 是 在 多 媒体 环境 中 尽 可 能 好 在- 。、 保 证 保 真 度 和 ，_ 方 
























































面 模 拟人 与 人 在 面对面 时 使 用 的 各 种 感官 和 能 力 * 多 媒体 的 目标 是 计算 机 与 用 户 、 

户 与 用 户 之 间 的 一 >” ， 即 改善 人 与 计算 机 之 间 的 交互 界面 。 

2， 选 择 题 入 一 

(1) 在 计算 机 领域 中 ， 能 够 表示 信息 的 文字 、 图 形 、 声 音 、 图 像 、 动 画 等 都 可 以 称 为 。 。 
A. 数据 B. 数字 C. 媒体 D. 信息 

(2) 下 列 说 法 正确 的 是 。 
A. 超 文 本 就 是 超 媒体 B. 媒体 不 一 定 是 媒介 
C. 信息 是 对 人 有 用 的 数据 D. 多 媒体 与 多 媒体 技术 根本 没有 区 别 








(3) 多 媒体 技术 强调 的 是 交互 式 综合 处 理 多 种 信息 媒体 (尤其 是 感觉 媒体 ) 的 技术 。 从 本 质 
上 来 看 ， 它 具有 信息 载体 的 3 个 主要 特征 。 这 3 个 主要 特征 是 。 

















A. 多 样 性 、 集 成 性 和 交互 性 B. 控制 性 、 交 互 性 和 复杂 性 

C. 控制 性 、 综 合 性 和 多 维 化 D. 易 变性 、 集 成 性 和 可 扩展 性 
(4) 一 种 比较 确切 的 说 法 是 ， 多 媒体 计算 机 是 能 够 ”的 计算 机 。 

A. 接受 多 媒体 信息 B. 输出 多 媒体 信息 





C. 将 多 媒体 的 信息 融 为 一 体 进 行 处 理 。 D. 播放 音乐 
(5) 信息 的 载体 与 表现 形式 是 。 
A. 媒体 B. 多 媒体 C. 报纸 D. 电视 
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的 使 用 及 协调 窗口 软件 环境 的 各 项 操作 。 


















































I 政史 并 体 找 坟 肥 其 应 用 人 第 之 服 ) 
(6) 下 面 选项 中 ， 属 于 表示 媒体 范畴 的 是 。 
A. 文本 B. 图 像 编码 C. 键盘 D. 电子 邮件 系统 
(7) 下 面 选项 中 ， 属 于 多 媒体 与 多 媒体 技术 范畴 的 是 
A. 彩色 电视 。”B. 音响 系统 C. 网 络 交互 游戏 。“D， 电影 机 
(8) 在 多 媒体 计算 机 系统 中 ，__ 是 多 媒体 计算 机 硬件 和 软件 的 桥梁 。 
A. 多 媒体 素材 制作 平台 B. 多 媒体 外 围 设备 
C. 多 媒体 1/0 接口 D. 多 媒体 应 用 系统 
(9) 在 多 媒体 系统 自 上 而 下 的 层次 结构 中 ， 顶 层 是 。 
A. 多 媒体 应 用 系统 B. 多 媒体 创作 系统 
C. 多 媒体 1/0 接口 D. 多 媒体 核心 系统 软件 
(10) 在 多 媒体 技术 的 发 展 过 程 中 ，_ ”解决 了 多 媒体 信息 数据 量 大 的 瓶颈 。 
A. 数据 压缩 技术 B. 网 络 技术 
C. 模拟 技术 D. 所 革 术 人 
(11) 多 媒体 技术 是 以 计算 机 为 工具 ， 接 受 、 me 
A 中文、 英文 、 日 文 B. 、 动 画 、 声 音 、 文 字 和 影视 
C. 拼音 码 、 五 笔 字 型 码 54 人 命令、 鼠标 操作 
(12) 下 列 选项 中 属于 多 媒体 范畴 的 是 x 
A， 交互 式 视频 游戏 sk B. 报纸 
C. 彩色 画报 NN D. 彩色 电视 
(13) 不 属于 信息 交换 媒体 ee 
A， 网 络 Bn 内 次、 c_ 5 加、 D， 电子 邮件 


(14) 在 多 媒体 系统 自 上 而 下 的 层次 结构 中 ， 一 关系 统 软 人 的 以， 可 控制 多 媒体 设备 


, YY 多 媒体 创作 系统 
























































A St 
C Se 榜 口 会 ” D. 多 媒体 核心 系统 软件 
(15) 电视 主 NTSC、PAL、SECAM 3 种 , 目前 使 用 PAL 制式 的 国家 和 地 区 有 _ 等 。 
A. 美国 、 日 本 、 韩 国 B. 法 国 、 俄 罗斯 、 新 加 坡 
C. 中 国内 地 、 德 国 、 英 国 D. 美国 、 法 国 、 日 本 
(16) 下 列 选项 中 ， 不 属于 多 媒体 技术 应 用 的 是 __ 
A. 计算 机 辅助 训练 B. 脉冲 电话 
C. 虚拟 现实 D. 网 络 视频 会 议 
(17) 能 够 将 摄像 机 、 电 视 机 输出 的 视频 信号 输入 到 计算 机 中 ， 并 将 其 转换 成 计算 机 可 辩 





























别 的 数字 数据 ， 存 储 在 计算 机 中 ， 成 为 可 编辑 处 理 的 视频 数据 文件 的 是 _ 
A. 音频 卡 B. 视频 采集 卡 C. 主板 卡 D. 内 存 卡 
(18) 下 列 多 媒体 设备 中 ， 既 能 输入 又 能 输出 的 设备 是 
A. 电子 笔 B. 触摸 屏 Gs 显示 器 D. 打印 机 
(19) 3G 手机 属于 __ 新 媒体 。 
A. 网 络 直播 B. 移动 媒体 C. VOD D. 数字 电视 


(20) 多 媒体 技术 是 一 门 综合 运用 _ 及 多 种 学 科 和 信息 领域 技术 成 果 的 技术 ， 是 信息 社 


会 发 展 的 一 个 新 方向 。 


区 





A. 行为 技术 B. 计算 机 技术 C. 通信 技术 D. 视听 技术 








多 媒体 技术 概述 一 
3. 判断 题 
(1) 音频 、 视 频 都 是 连续 的 数字 媒体 ， 因 此 ， 它 们 的 性 质 是 完全 相同 的 。 ( ) 
(2) 一 般 情 况 下 ， 可 以 认为 图 形 与 图 像 之 间 没 有 任何 关系 。 这 

















(3) 多 媒体 技术 就 是 采用 计算 机 技术 把 文字 、 声 音 、 图 形 、 图 像 和 动画 等 多 媒体 综合 一 体 
化 ， 使 之 建立 起 逻辑 连接 ， 并 能 对 它们 获取 、 压 缩编 码 、 编 辑 、 处 理 、 存 储 和 展示 。 即 多 媒 















































体 技术 就 是 把 声 、 文 、 图 、 像 和 计算 机 集成 在 一 起 的 技术 。 ( ) 
(4) 超 文本 将 信息 自然 地 相连 接 , 而 不 像 纸 写 文 本 那样 将 结构 分 层 归 类 , 它 以 这 种 方式 实 

现 对 无 顺序 数据 的 管理 。 tC 本 
(5) 超 媒 体 是 超 文本 的 扩展 ,因为 除了 所 含 的 文本 外 , 这 些 电 子 文档 也 将 包括 任何 可 以 以 

电子 存储 方式 进行 储存 的 信息 ， 如 音频 、 动 画 视 频 、 图 形 或 全 运动 视频 。 6 
4. 简 答题 伦 


(CD 计算 机 与 5 种 媒体 的 对 应 关系 如 何 ? eK 
(2) 多 媒体 系统 由 哪些 部 分 组 成 ? | \\ 
(3) 什么 是 视频 、 图 形 、 图 像 ? AR 
(4) 图 形 与 图 像 有 何 区 别 ? NS 
G) 多 媒体 技 术 的 主要 研究 内 容 有 哪些 7、 


QA l 
站 > 
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第 2 韶 。 音频 信号 处 理 技术 


教学 提示 


ee 

> 声音 是 携带 信息 的 极其 重要 的 媒体 ， 音 频 信号 处 理 技术 是 多 媒体 信 
息 处 理 的 核心 技术 之 二 , 它 是 多 媒体 技术 和 多 媒体 产品 开发 中 的 重 
要 内 容 。 人 类 上 生活 的 环境 中 声音 的 种 类 繁多 ， 如 人 的 声音 、 乐 器 声 、 
动物 发 出 的 声音 机 器 产生 的 声音 ， 以 及 自然 界 的 雷 声 、 风 声 、 和 十 
声 等 .1 利用 现代 信息 处 理 技术 对 各 种 声音 进行 模拟 、 录 制 、 编 码 、 
重 构 ” 编辑 和 应 用 ， 便 构成 予 音频 入 号 处 理 技术 的 主要 内 容 ， 

教学 目标 

Le 

> 本 章 主要 介绍 多 媒体 计算 机 中 音频 信号 处 理 技术 的 基本 原理 、 硬 
件 、 软 件 及 其 应 用 前 景 。 通过 对 本 章 的 学 习 ， 要 求 掌握 计算 机 声音 
处 理 的 常用 技术 与 原理 ， 上 声音 处 理 硬件 的 基本 构成 、 常 用 的 声音 合 
成 方法 、 上 声音 的 编码 与 压缩 技术 、 数 字音 频 的 合成 及 数字 声音 的 应 
用 知识 。 


2.1 声音 的 特性 、 类 型 与 处 理 





声音 是 人 类 交互 的 最 自然 的 方式 。 自 计算 机 诞生 以 来 ， 人 们 便 梦想 能 与 计算 机 进行 面 
面 的 “交谈 ”， 以 致 于 在 许多 科幻 小 说 和 电影 中 出 现 了 能 说 会 道 的 机 器 人 。 科 学 家 为 实现 此 
标 付出 了 艰辛 的 劳动 ， 并 取得 了 较 大 的 突破 。 尤 其 在 20 世纪 90 年 代 大 量 出 现 的 多 媒体 计 
机 环境 中 ， 计 算 机 的 音频 技术 得 到 了 充分 的 体现 和 发 挥 。 计 算 机 是 怎样 处 理 声音 的 ? 要 加 
这 一 问题 ， 不 妨 先 对 自然 界 的 声音 现象 进行 较为 深入 的 了 解 。 


2.1.1 声音 的 特性 


自然 界 中 声音 是 靠 空气 传播 的 。 人 们 把 发 出 声音 的 物体 称 为 声 源 ， 声 音 在 空气 中 能 引起 
非常 小 的 压力 变化 。 例 如 ， 人 的 耳 杂 就 具有 这 种 功能 ， 声 源 所 引起 的 空气 压力 变化 ， 被 耳 打 
的 耳膜 所 检测 ， 然 后 产生 电信 号 刺激 大 脑 的 听觉 神经 ， 从 而 使 人 们 能 感觉 到 声音 的 存在 。 自 
然 界 的 各 种 声音 大 都 具有 周期 性 强 弱 变化 的 特性 ， 因 pie tit 
们 将 这 种 变化 用 一 种 图 示 的 方法 一 一 正弦 波 来 形象 地 表示 ， 如 图 2.1 所 示 。 
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图 2.1 声音 的 正弦 波 表示 


在 图 2.1 中 , 人们 将 曲线 上 的 任 一 点 再 次 出 现 所 需 时 间 间 隔 称 为 周期 ,而 1s 内 声音 由 高 ( 压 
力 强 ) 到 低 (压力 低 ) 再 到 高 (压力 强 )， 这 个 循环 出 现 的 次 数 称 为 频率 。 频 率 越 高 ， 声 音 越 高 ， 以 
赫兹 (Hz) 为 其 度量 单位 。 一 个 系统 能 够 接收 的 频率 是 有 限 的 ， 人 们 把 系统 能 够 接受 的 从 最 低 
频率 到 最 高 频率 之 间 的 范围 称 为 系统 的 带宽 (Bandwith)。 人 类 能 够 接受 的 听觉 带宽 是 20Hz 一 
20kHz。 

从 听觉 的 角度 来 看 ， 声 音 有 其 自身 特有 的 特性 、 声 学 原理 及 质量 标准 。 

1. 上 声音 的 三 要 素 

声音 的 三 要 素 为 音调 、 音 强 、 音 色 。 音 调 与 声音 的 频率 有 关 ， 频 率 高 则 声音 高 ， 频 率 低 
则 声音 低 。 音 强 又 称 响 度 ， 取 决 于 声音 的 幅度 ， 即 振幅 的 大 小 和 强 弱 。 而 音色 则 由 混入 基 音 
的 泛音 所 决定 ， 每 个 基 音 又 都 有 其 固有 的 频率 和 不 同音 强 的 泛音 ， 从 而 使 得 每 个 声音 具有 特 
殊 的 音色 效果 。 
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下 多 媒体 技术 及 其 应 用 (第 这 服 ) 


2. 上 声音 的 连续 谱 特性 

声音 是 一 种 弹性 波 ， 声 音信 号 可 以 分 成 周期 信号 与 非 周期 信号 两 类 。 周 期 信号 即 为 单一 
频率 音调 的 信号 ， 其 频谱 是 线性 谱 ; 而 非 周期 信号 包含 一 定 频带 的 所 有 频率 分 量 ， 其 频谱 是 
连续 谱 。 真 正 的 线性 谱 仅 可 从 计算 机 或 类 似 的 声音 设备 中 听 到 ， 这 种 声音 听 起 来 十 分 单调 。 
其 他 声音 信号 或 者 属于 完全 的 连续 谱 ， 如 电路 中 的 平滑 噪声 ， 听 起 来 完全 无 音调 ， 或 者 属于 
线性 谱 中 混 有 一 段 段 的 连续 谱 成 分 ，5 只 不 过 这 些 连 续 谱 成 分 比 起 那些 线性 谱 成 分 来 说 要 弱 ， 
以 致使 得 整个 声音 还 是 表现 出 线性 谱 的 有 调 特性 , 也 正 是 这 些 连 续 谱 成 分 使 声音 听 起 来 饱满 、 
生动 。 自 然 界 的 声音 大 多 属于 这 一 种 。 

3， 上 声音 的 方向 感 特性 

声音 的 传播 是 以 声波 形式 进行 的 。 由 于 人 类 的 耳 杂 能 够 判别 出 声音 到 达 左 右 耳 的 相对 时 
差 、 声 音 强度 ， 所 以 能 够 判别 出 声音 的 方向 及 由 于 空间 使 声音 来 回 反射 而 造成 声音 的 特殊 
间 效 果 。 因 此 ， 现 在 的 音响 设备 都 在 模拟 这 种 立 体 声 效果 和 空间 感 效果 。 在 现 有 的 多 媒体 计 
算 机 环境 中 ， 声 音 的 方向 感 特性 也 是 试图 要 实现 的 需求 艺 一 


4. 声音 的 时 效 性 
声音 具有 很 强 的 时 效 性 ， 没 有 时 间 也 就 没有 声 党 ， 声音 适合 在 一 个 时 间 段 中 表现 。 声 音 
处 于 - -种 伴随 状态 ， 如 伴音 、 伴 奏 等 ;, 起 演 沫 气氛 的 作用 。 由 于 时 间 性 ， 声 音 数据 具有 
的 前 后 相关 性 ， 因 而 ， 数 据 量 要 大 得 多 实时 性 要 求 也 比较 高 。 
5， 上 声音 的 质量 

音 的 质量 与 声音 的 频率 范围 有 关 。 一 般 说 来 ， op 的 质 
给 出 | 了 不 同和 类 天 音 的 频 宽 。- 在 有 些 情况 下 ， 系 统 所 提供 的 声音 媒体 并 不 能 雪 
宽度 ， 这 会 对 声音 质量 有 影响 。 因 此 ， 要 对 声音 质量 确定 一 个 衡量 的 标准 。 对 语音 而 言 ， 常 
用 可 届 度 、 清晰 度 、 自 然 度 来 衡量 ， 而 对 音乐 来 说 ， 保 真 度 、 空 间 感 、 音 响 效果 都 是 重要 的 
指标 。 现 在 对 声音 主观 质量 度量 比较 通用 的 标准 是 5 分 制 ， 各 档次 的 评分 标准 见 表 2-2。 

表 2-1 不 同 种 类 声音 频 宽 


































































声音 种 类 频 宽 范围 
次 声 (Infra-sound) 0 一 20Hz 
电话 语音 200Hz 一 3.4kHz 
调幅 广播 50Hz 一 7kHz 
调频 广播 20Hz 一 15SkHz 
音响 20Hz 一 20kHz 
超声 (Ultrasound) 20kHz~1GHz 


表 2-2 声音 质量 的 评分 标准 
评价 
















失真 级 别 




















5 优 (Excellent) 感觉 不 到 声音 失真 

4 良 (Good) 刚 察觉 但 不 讨厌 

这 中 (Fair) lL 

2 差 (Poor) 感 
1 劣 (Bad) 严重 失真 ， 令 人 反感 
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2.1.2 ”声音 的 类 型 与 处 理 


自然 界 中 存在 着 各 种 声音 ， 按 声音 的 频 宽 范围 来 分 ， 声 音 可 分 为 4 种 类 型 ， 次 声 、 可 听 
声 、 超 声 与 特 超声 (1GHz~-10THza)， 表 2-1 给 出 了 前 3 种 声音 的 频 宽 范围 ,人 类 的 听觉 范围 是 
20Hz~20kHz， 这 主要 取决 于 每 个 人 的 年 龄 和 耳 休 的 特性 。 次 声 、 超 声 与 特 超声 均 非 可 听 声 。 
超 音频 信号 具有 很 强 的 方向 性 ， 而 且 可 以 形成 波束 ， 在 工业 上 得 到 广泛 的 应 用 ， 如 超声 波 探 
测 仪 ， 超 声波 焊接 设备 等 就 是 利用 这 种 信号 。 

车 按 声 音 在 计算 机 中 表示 的 格式 和 处 理 的 方法 不 同 ， 主 要 有 以 下 几 类 。 

1， 波 形声 音 

声音 是 由 物体 的 振动 产生 的 ， 这 种 振动 有 振动 频率 和 振动 幅度 两 个 要 素 ， 用 时 间 1 的 函 
数 表现 为 一 个 连续 波形 。 计 算 机 并 不 能 直接 使 用 连续 的 波形 来 表示 声音 ， 必 须 每 隔 固定 的 时 
间 对 波形 的 幅 值 进行 采样 ， 用 得 到 的 一 系列 数组 量 来 表示 声音 ,波形 声音 就 是 对 自然 界 声 音 
进行 数字 化 采样 并 量化 得 到 的 结果 , 它 是 自然 界 中 所 有 声音 的 “第 一 印象 ” 或 称 为 数字 副本 ， 
eine nti 谷 了 所 有 的 声音 形式 ， 任 何 
一 种 声音 都 可 以 按 波形 声音 加 以 处 理 。 但 在 多 媒体 计算 机 中 7 有 些 声 音 有 附加 的 规律 和 特性 ， 
可 以 用 更 简单 的 方法 存储 、 处 理 和 表现 。 SS 

2. 语音 -Vy 

Se gp Se ， 

因为 人 的 说 话 声 不 仅 是 一 种 波形 , 汶 因 还 具有 内 在 的 语言 、 语 音 学 内 涵 ， 可 以 经 由 特殊 

方法 提取 、 表 现 (如 语音 识别 )， 所 以 把 它 作为 一 种 个 别 的 听觉 媒体 。 
~ VV r A 

3， 音乐 YU ,XX 

音乐 生 声 的 区 别 主 要 在 于 它们 是 否 具 有 周期 性 帮 察 其 时 志波 形 ， 普 乐 的 波形 随时 间 
做 周期 性 变化 ， 噪 声 则 不 然 。 观 察 其 频谱 值 '- 昔 乐 包括 确定 的 基 频 谱 和 这 个 基 频 整数 倍 的 谱 
Rn 




















































































































示 、 用 合成 方 i 的 电子 音乐 一 一 MIDI 音乐 。 它 与 语音 相 比 更 加 规范 。 
4. 真实 感 声 音 


由 计算 机 生成 的 、 具有 空间 特性 的 三 维 真实 感 声音 听 起 来 虽然 类 似 自 然 界 声音 , 但 存储 、 
处 理 和 发 声 的 方法 与 波形 声音 完全 不 同 。 对 真实 感 声音 模拟 的 研究 ， 比 起 三 维 真实 感 图 形 的 
研究 还 显得 很 不 成 熟 ， 但 计算 机 合成 语音 的 技术 一 直 是 研究 的 热点 。 
多 媒体 计算 机 主要 处 理 的 是 人 类 听觉 范围 内 的 可 听 声 。 声 音 的 处 理 主 要 有 声音 的 录制 、 
可 放 、 压 缩 、 传 输 和 编辑 等 。 这 涉及 声音 两 种 最 基本 表示 形式 : 模拟 音频 和 数字 音频 ， 下 面 
介绍 这 两 种 形式 的 基本 概念 。 
1) 模拟 音频 
自然 的 声音 是 连续 变化 的 ， 它 是 一 种 模拟 量 ， 人 类 最 早 记录 声音 的 技术 是 利用 一 些 机 械 
、 电 的 或 磁 的 参数 随 着 声波 引起 的 空气 压力 的 连续 变化 而 变化 来 模拟 和 记录 自然 的 声音 

并 研制 了 各 种 各 样 的 设备 ， 其中, 较 普 遍 且 人 们 较 熟 悉 的 要 数 麦 克 风 ( 即 话 简 ) 了 。 当 人 们 对 着 
麦克 风 讲 话 时 ,麦克 风能 根据 它 周 围 空气 压力 的 不 同 变化 而 输出 相应 连续 变化 的 电压 值 ， 这 
种 变化 的 电压 值 便 是 一 种 对 人 类 讲话 声音 的 模拟 ， 是 一 种 模拟 量 ， 称 为 模拟 音频 (Analog 
audio)。 它 把 声音 的 压力 变化 转化 成 电压 信号 ， 电 压 信 号 的 大 小 正比 于 声音 的 压力 。 当 麦克 风 
输出 的 连续 变化 的 电压 值 输入 到 录音 机 时 ， 通 过 相应 的 设备 将 它 转换 成 对 应 的 电磁 信号 记录 
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J 区 并 体 技术 发 其 应 用 (第 之 腑 ) 
在 录音 磁带 上 ， 因 而 便 记 录 了 声音 。 但 以 这 种 方式 记录 的 声音 不 利于 计算 机 存储 和 处 理 ， 因 
为 计算 机 存储 的 是 一 个 个 离散 的 数字 。 要 使 得 计算 机 能 存储 和 处 理 声音 ， 就 必须 将 模拟 音频 
数字 化 。 

2) 数字 化 音频 

数字 化 音频 (Digital audio) 的 获得 是 通过 每 隔 一 定 的 时 间 间 隔 测 一 次 模拟 音频 的 值 (如 电 
压 ) 并 将 其 数字 化 。 这 一 过 程 称 为 采样 ， 每 秒 钟 采 样 的 次 数 称 为 采样 率 。 一 般 地 ， 采 样 率 越 高 ， 
记录 的 声音 就 越 自然 ， 反 之 ， 若 采样 率 太 低 ， 将 失去 原 有 声音 的 自然 特性 ， 这 一 现象 称 为 失 
真 。 由 模拟 量变 为 数字 量 的 过 程 称 为 模 一 数 转换 。 
上 述 可 知 : 数字 音频 是 离散 的 ， 而 模拟 音频 是 连续 的 ， 数 字音 频 质量 的 好 坏 与 采样 率 
密切 相关 。 数 字音 频 信息 计算 机 可 以 存储 、 处 理 和 播放 。 但 计算 机 要 利用 数字 音频 信息 驱动 
扬声器 发 声 , 还 必须 通过 一 个 设备 将 离散 的 数字 量 再 变 为 连续 的 模拟 量 ( 如 电压 等 ) 的 过 程 , 这 
一 过 程 称 为 数 一 模 转换 。 因 此 ， 在 多 媒体 计算 机 环境 中 ， 要 使 计算 机 能 记录 和 发 出 较为 自然 
的 声音 ， 必 须 具备 这 样 的 设备 。 目 前 ， 在 大 多 数 个 人 多 媒体 计算 这 些 设 备 集中 在 一 块 


卡 上 ， 这 块 卡 称 为 声卡 ， 又 称 音 闫 卡 。 声 让 的 一 般 作用 如 欧 @% 烛 直 。 
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图 2.2 多 媒体 计算 机 中 声卡 录音 、 放 音 的 处 理 过 程 


2.2 ”声卡 的 构成 与 功能 





声卡 是 声音 处 理 和 转换 的 设备 。 以 插件 的 形式 紧 固 在 计算 机 主板 的 扩展 模 上 ， 或 集成 在 
计算 机 主板 上 (此 种 情况 称 其 为 声音 处 理 部 件 可 能 更 合适 )。 
2.2.1 声卡 的 组 成 

声卡 的 类 型 众多 ， 结 构 也 不 尽 相 同 。 发 展 至 今 ， 声 卡 主要 分 为 板 卡 式 、 集 成 卡 和 外 置 卡 
3 种 接口 类 型 ， 以 适用 于 不 同 用 户 的 需求 。 不 论 是 什么 类 型 的 声卡 ， 一 般 地 说 一 块 声 卡 至 少 
应 具有 以 下 部 件 。 

1.， 实现 录音 和 放 音 的 部 件 

实现 录音 和 放 音 的 部 件 包括 在 声音 输入 过 程 中 把 模拟 信号 转换 为 数字 信号 的 模 一 数 转换 电 
路 ， 以 及 在 声音 输出 过 程 中 把 数字 信号 转换 为 模拟 信号 的 数 一 模 转换 电路 。 每 种 声卡 都 具有 固 
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定 的 采样 参数 。 如 果 录 音 电路 使 用 的 参数 是 22.05kHz 和 16bit， 放 音 电路 也 将 使 用 同样 的 参数 。 

早期 的 声卡 均 采用 8bit 位 宽 ， 目 前 多 数 为 32bit 及 以 上 了 。16bit 卡 的 采样 精度 可 达到 
1/65 536， 对 多 数 应 用 均 已 足够 了 。 

2. 支持 乐器 合成 的 MIDI 合 成 器 

支持 乐器 合成 的 MIDI 合成 器 是 决定 声卡 音质 的 关键 部 件 。 由 于 MIDI 音乐 的 质量 要 求 较 
高 ， 许 多 声卡 制造 商 致力 于 提高 合成 器 的 质量 ， 便 使 得 音乐 合成 技术 不 断 获得 改进 。 早 期 的 合 
成 器 采用 FM( 频 率 调制 ) 合 成 技术 , 通过 用 一 个 正弦 波 修正 另 一 个 正弦 波 的 方法 来 模拟 各 种 乐器 
风声 音 ， 带 有 较 深 的 人 工 合成 痕迹 。 现 在 流行 的 声卡 普遍 采用 “ 波 表 ”(Wave Table) 合 成 技术 ， 
其 中 又 有 “ 硬 波 表 ” 和 “ 软 波 表 ” 之 分 。 硬 波 表 将 各 种 真实 乐器 的 数字 化 声音 信息 存储 在 声卡 
上 的 专用 存储 器 中 ， 使 用 时 再 由 合成 器 调用 并 处 理 。 软 波 表 则 将 乐器 的 数字 化 声音 信息 存储 在 
系统 的 硬盘 上 , 待 使 用 时 再 调 入 系统 内 存 由 CPU 进行 处 理 。 软 波 表 合 成 器 显然 比 硬 波 表 合成 器 
便宜 ,但 却 增加 了 CPU 的 负担 ,对 计算 机 系统 的 硬件 ,尤其 是 CPU 处 理 速 度 的 要 求 也 高 得 多 。 

近 几 年 随 着 PCI 总 线 的 流行 而 推出 的 PCI 声卡 ， 把 硬 波 表 和 软 波 表 的 优点 结合 起 来 ， 提 
1 了 一 种 新 的 MIDI 合成 方案 。 其 具体 做 法 是 ， 波 表 存储 在 硬盘 上 ， 使 用 时 调 入 内 存 ， 但 并 
E CPU 处 理 ， 而 是 经 PCI 总 线 传 回声 卡 ， 由 声卡 总 的 专用 合成 芯片 处 理 ， 这 被 称 为 “可 
本 ” (Down Loadable Sample) 的 合成 技术 (简称 DES 技术 )， 现 已 成 为 新 - 一 代 PCI 声卡 的 

盘 上 的 样本 库 可 选择 2MB、4MB 乃至 :8MB 等 不 同 的 大 小 ， 音 源 与 音质 也 可 由 用 户 

， 而 且 其 内 容 可 经 常 更 新 ， 使 声 上 的 音频 真正 做 到 生动 、 灵活 和 多 样 。 

3， 连接 声音 设备 的 各 种 端口 、、 sa 

声卡 是 音频 输入 /输出 设备 的 公用 接口 ， 也 是 沟通 主机 和 将 频 设 备 的 通道 。 通 常 在 声卡 的 
后 端 设 有 许多 端口 。 声 卡 安装 后 > 这 些 端口 便 伸 出 机 箱 之 外 ， 供 用 户 连接 音箱 、 扬 声 器 等 音 
频 设 备 。 声 卡 与 其 他 设备 连接 如 图 2.3 所 示 。 声 卡 中 的 “Line in” 插 孔 可 连接 录音 机 、 袖 珍 
CD 播放 机 和 合成 器 等 将 其 播放 的 音频 信息 输入 计算 机 ; “Microphone” 捅 和 孔 与 麦克 风 相连 ， 
用 于 录音 ;,“Speakerout” 可 与 扬声器 、 耳机 租 连 ， 如 要 将 一 个 功率 很 大 的 音箱 连 入 计算 机 ， 
则 需 先 将 功放 与 “Line out” 相 连 ， 然 后 将 音箱 与 功放 相连 ; “Joystick/MIDI Adapter” 可 与 游 
戏 操纵 杆 、MIDI 设备 相连 。 
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图 2.3 ”声卡 与 其 他 设备 连接 
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二 a 


下 | 多 媒体 找 坟 及 其 应 用 第 之 服 ) 


“2.2.2 声卡 的 主要 功能 


(1) 录制 与 播放 声音 。 通 过 接 在 声卡 上 的 话 简 录制 声音 ， 并 以 文件 形式 保存 在 计算 机 中 ， 
随时 可 打开 声音 文件 进行 播放 。 声 音 文件 的 格式 可 因 使 用 不 同 的 软件 而 不 同 。 

(2) 音乐 合成 。 利 用 声卡 的 合成 器 将 存储 在 计算 机 内 存 中 的 MIDI 文件 合成 为 音乐 乐 
通过 混合 器 混合 和 处 理 多 个 不 同音 频 源 的 声音 ， 控 制 和 调节 音量 大 小 ， 最 后 送 至 音箱 或 耳 机 
播放 。 

(3) 压缩 和 解压 缩 音频 文 件 。 目前 大 多 数 声 卡 上 都 固化 了 不 同 标准 的 音频 压缩 和 解压 缩 软 
件 ， 常 用 的 压缩 编码 方法 有 ADPCM( 自 适应 差分 脉冲 编码 调制 ) 和 ACM(Audio Compression 
Manager， 音 频 压缩 管理 器 ) 等 ， 压 缩 比 为 2 : 1 一 5 : 1。 

(4) 具有 与 MIDI 设备 和 CD 驱动 器 的 连接 功能 。 通 过 声卡 上 的 MIDI 接口 ， 计 算 机 可 以 
同 外 界 的 MIDI 设备 相连 接 ， 如 连接 电子 琴 、 电 吉他 等 ,使 MPC 有 创作 计算 机 乐 和 播放 
MIDI 文 件 的 功能 。 游 戏 杆 也 可 通过 MIDI 接口 和 作 起 来 得 心 应 手 。 


2.2.3 ”声卡 的 性 能 指标 、 


声卡 的 性 能 指标 决定 了 声卡 声音 采集 、 合 成 与 条 的 质量 ， 主 要 取决 于 以 下 几 人 方面 

(1) 采样 分 辩 率 ， 即 采样 位 数 ， 有 人、 24 位 、32 位 。 其 中 16 位 的 声卡 比 
较 流行 。 采 样 位 数 越 大 ， 分 辩 率 越 高 ， 失 实 度 越 小 ， 录 制 和 回放 的 声音 就 越 真实 。 

(2) 采样 速率 ;主流 声卡 分 为 11.025KHZ、22.05kHz、44.1kHz、48kHz 几 个 等 级 ， 采 样 速 
率 越 高 ， 音 质 越 真实 。 宁可 来 和 二 上 的 半 涪 、 悦耳 、 噪 声 的 程度 。 

G) 声 道 数 : 包括 单 声 道 双 声 道 和 多 声 道 等 。 党 疯 的 有 8 位 音声 ; 道 、8 位 立体 声 、16 位 
立体 声 、 多 通道 16 位 立体 声 、 多 通道 24 位 立体 声 (DVD 音频 标准 )。 

(4) 兼容 性 : ADLIB 标准 和 SB 标准 的 声卡 兼容 性 好 ， 可 以 获得 较 多 的 软件 支持 。 

(5) 功能 接 同 * 较 好 的 声卡 带 有 MIDI 谷 成 器 (数字 音乐 接口 ,可 连接 类 似 于 电子 琴 的 MIDI 
设备 , 通过 弹 奏 乐器 可 将 音乐 记录 并 转换 成 MIDI 格式 文件 ), 以 及 CD-ROM、 DVD-ROM 接口 。 































































































2.3 波形 声音 的 数字 化 





上 节 可 知 ， 自 然 界 的 声音 是 一 种 模拟 的 音频 信息 ， 是 连续 量 ， 而 计算 机 只 能 处 理 离散 
的 数字 量 ， 这 就 要 求 必须 将 声音 数字 化 。 音 频 信息 数字 化 的 优点 是 传输 时 抗 干扰 能 力 强 ， 存 
储 时 重 放 性 能 好 ， 易 处 理 ， 能 进行 数据 压缩 ， 可 纠 错 ， 容 易 混 合 。 要 将 音频 信息 数字 化 ， 暴 
关键 的 步骤 是 采样 、 量 化 和 编码 ， 本 节 将 详细 介绍 与 此 相关 的 概念 硬件、 技术 与 实现 方法 。 


23i 深 样 


在 数字 领域 中 ， 将 模拟 信号 数字 化 已 有 了 比较 坚实 的 理论 基础 和 极为 成 熟 的 实现 技术 ， 
其 中 有 一 种 称 为 PCM(Pulse Code Modulation, 脉冲 编码 调制 ) 的 技术 在 数字 音频 系统 中 广 为 使 
。 图 2.4 给 出 了 PCM 方法 的 工作 原理 ， 在 该 图 中 ， 曲 线 代表 声 波 曲 线 ， 是 连续 变化 的 模拟 
量 (如 电压 ) 时 间 轴 以 一 种 离散 分 段 的 方式 来 表示 ， 并 且 波 形 以 固定 的 时 间 间 隔 来 测量 其 值 ， 
这 种 处 理 称 为 采样 。 每 一 个 采样 的 电压 用 一 个 整数 数字 化 ， 计 算 机 存储 或 传输 这 些 数据 ， 而 
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不 是 波形 自身 .采用 的 采样 频率 (每 秒 采样 的 次 数 ) 称 为 采样 率 ,一 般 在 采样 中 采样 率 是 固定 的 。 
采样 率 的 倒数 称 为 采样 时 间 。 例 如 ， 某 个 系统 的 采样 率 为 每 秒 40 000 次 ， 则 它 的 采样 时 间 为 
1/40 000s。 因 而 采样 率 越 高 ， 采 样 时 间 越 短 ， 记 录 的 数字 音频 信息 与 模拟 音频 就 越 相似 。 对 
于 一 个 数字 音频 系统 而 言 ， 选 择 合适 的 采样 频率 ， 保 证 数字 化 音频 不 失真 ， 是 最 重要 的 设计 
工作 之 一 ， 因 为 它 决定 了 系统 的 带宽 。 那 么 ， 如 何 采 样 才能 精确 地 表示 音频 波形 呢 ? 

Vv 了 
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OO 下 不 不 不 不 万 不 有 To b RTE TT TT Ts DTo T 
(a) 在 离散 时 间 点 采样 《b) 模拟 输入 被 量化 成 离散 的 - 进 制 代码 


图 2.4 PMC 方法 的 工作 原理 

人 们 通过 对 采样 的 长 期 研究 ， 已 形成 了 一 套 采 样 理 论 。 尼 奎 斯 特 Nyquisb 已 证 明 : 要 完 
全 表示 一 个 具有 5/2Hz 带宽 的 波形 ， 和 需要 每 秒 S 的 采样 率 。 换 句 话说 ， 要 获得 一 个 无 损 的 采 
样 ,就 必须 以 波形 最 高 允许 频率 的 两 们 作为 采样 率 。 例 如 ,次 类 能 够 接受 的 听觉 带宽 是 20Hz 一 
20kHz。 按 照 这 个 理论 ， 要 产生 听 得 见 的 频率 范围 就 需要 大 于 40kHz 的 采样 率 。 为 了 满足 这 
个 需要 ，Philips 和 Sony 次 司 在 设计 光盘 时 ， 选 择 了 44.IkHz 的 采样 率 。 这 个 采样 频率 也 是 
Windows 所 支持 的 较 高 采 在 Windows 下 所 支持 的 其 他 采样 率 还 有 11.025kHz 和 
22.05kHz， 这 些 可 用 带宽 都 小 于 尼 奉 斯 特 理论 二 的 最 大 值 的 最 高 率 。 在 实际 应 用 中 ， 为 了 避 
免 别 名 噪声 (Aliasinig Noise) 的 导入 ， 大 于 等 于 尼 硅 斯 特 频率 必定 要 有 大 量 的 信号 衰减 。 这 个 误 
减 假设 发 生 在 最 高 可 用 频率 和 尼 硅 斯 特 频率 之 间 。 为 了 将 这 些 频率 和 现实 世界 相 联 系 , 表 2-3 
























给 出 了 一 些 通常 声音 的 频率 范围。 


表 2-3 通常 声音 的 频率 范围 







基本 的 频率 范围 第 四 等 音 /泛音 的 频率 





















大 钢 酚 | Al 一 CsC27.1 一 4.186Hz) 12.558kHz 
长 笛 | Ci 一 Be(261.63 一 3.951HZ) 11.853kHz 
电 吉 他 | Ei~Es(82.41Hz~1.328kHz) 3.984kHz 
管 乐 | C2~C10(32.7~932.33Hz) 25.116kHz 

| E: 一 B 降 4 调 (164.81 一 932.33Hz) 2.797kHz 








50 一 800Hz 





2.4kHz 


从 表 中 可 以 看 到 除 管 乐 外 ， 其 他 声音 的 最 大 基 音 频率 都 小 于 5kHz， 即 能 够 以 低频 
11.025kHz 被 录音 而 无 任何 失真 。 
采样 后 得 到 的 音频 信息 ， 必 须 对 其 数字 化 。 
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一 3 量化 


将 采样 后 得 到 的 音频 信息 数字 化 的 过 程 称 为 量化 。 因 此 ， 量 化 也 可 以 看 作 在 采样 时 间 内 
测量 模拟 信息 值 的 过 程 。 在 日 常生 活 中 ， 我 们 也 可 以 找到 量化 的 例子 ， 如 假设 有 两 个 电压 表 
分 别 连 到 模拟 信号 源 上 ， 其 中 一 个 为 模拟 电压 表 ， 另 一 个 为 数字 电压 表 ， 如 图 2.5 所 示 。 

模拟 信 生源 














对 于 模拟 电压 表 ， 测 量 的 精 有 仪表 本 身 的 精确 度 ; 以 及 测量 者 眼睛 的 识别 率 。 对 
Er 例如 ， 员 2 位 数 , 是 13, 3 位 数 是 12.7， 
4 位 数 则 是 12.74。 们 可 以 通过 增加 数 电 的 位 数 来 提高 精度 ， 但 不 管 怎样 ， 对 





一 个 数字 系统 而 言 总 是 有 限 的 。 Rt 与 模拟 量 之 间 
总 存在 误差 。 对 人 此 ， 所 以 ， 量 化 的 精度 也 是 影响 音频 质量 
的 男人 和 


在 数字 系统 中 数量 级 的 刻画 通常 是 以 二 进 制 的 形式 来 描述 的 。 把 连续 的 幅 值 转换 成 离散 
的 幅 值 ， 采 用 的 量化 方法 一 般 是 均匀 量化 法 。 例 如 ， 把 0.000 0 一 1.000 0V 的 电压 信号 转换 成 
8 位 二 进 制 表 示 的 数 。0 一 1 之 间 有 无 穷 多 个 数值 ， 而 8 位 二 进 制 数 只 有 2 二 256 个 ， 即 0， 
1,2,3,4, …, 255。 因 此 , 0 一 1 之 间 的 电压 值 分 为 256 个 等 级 , 每 个 等 级 代表 1/256 王 0.003 9V。 
二 进 制 的 0 表示 0.000 一 0.039V， 用 二 进 制 的 1 代表 0.004 一 0.078V， 依 此 类 推 ， 显然 ， 量 
化 后 的 信号 丢失 了 信息 ， 而 且 引 进 了 量化 噪声 。 同 样 明显 的 是 ， 如 果 量 化 等 级 的 数目 越 多， 

那么 引进 的 噪声 就 越 小 ,这 就 是 为 什么 样本 用 16 位 二 进 制 表示 的 音响 质量 ， 比 用 8 位 表示 的 
音响 质量 要 好 得 多 的 原因 。 这 也 是 CD(Compact Disc- Digital Audio) 光 盘 和 CD-I 光盘 中 的 超级 
高 保 真 音乐 都 采用 每 个 样本 为 16 位 二 进 制 数 表 示 的 原因 。 
在 一 个 数字 系统 中 可 允许 的 二 进 制 数 的 位 数 称 为 字 长 ， 字 长 决定 了 音频 数字 化 系统 量化 
的 精度 ， 字 长 越 长 ， 精 度 越 高 (可 区 分 度 越 高 )， 当 然 ，A/D 转换 器 的 成 本 也 越 高 。 


1， 数字 系统 是 怎样 进行 量化 的 
通过 前 面 的 学 习 可 以 知道 ， 声 音 若 以 模拟 方式 表示 ， 则 可 表示 成 正弦 波 的 形式 。 对 该 声 
波 进行 采样 ， 就 是 将 时 间 轴 分 成 许多 相等 的 时 间 间 隔 ， 在 这 些 离散 的 时 间 点 上 测 得 其 电压 什 ， 
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处 理 过 程 如 图 2.4 所 示 。 在 该 图 中 ， 时 间 是 离散 的 ， 但 电压 轴 是 连续 的 ， 每 一 时 间 点 测 得 的 
电压 值 和 声波 曲线 上 相应 的 值 是 相等 的 。 测 得 模拟 信号 的 值 之 后 再 由 量化 器 对 其 数量 化 ， 转 
换 成 二 进 制 代码 (又 称 编码 )， 如 图 2.4(b) 所 示 。 

在 一 个 数字 系统 中 ， 通 过 对 模拟 量 波形 在 离散 的 周期 间隔 内 赋 以 有 限 的 级 别 来 对 模拟 信 
号 进行 编码 。 由 图 2.4(b) 可 以 看 到 , 影响 量化 精度 的 第 一 个 因素 应 是 用 于 编码 的 二 进 制 的 位 数 
( 即 字 长 )。 例 如 ，2 位 则 2?==4 有 4 个 区 分 度 ， 若 为 3 位 则 有 8 个 区 分 度 (2 二 8)， 若 为 4 位 ， 
二 进 制 则 有 16 个 区 分 度 (24 王 16)，16 位 则 有 65 536 个 区 分 度 (216 王 65 536)。 区 分 度 越 高 与 模 
拟 量 的 误差 就 越 小 。 第 二 个 因素 是 波形 允许 的 动态 范围 ( 称 为 振幅 )。 例 如 ， 系 统 若 采 用 16 位 
字 长 实现 ， 则 它 能 将 65 536 个 区 分 级 中 的 某 一 个 赋予 理想 的 模拟 波形 。 如 果 模 拟 波形 被 限定 
为 最 大 电压 级 别 峰值 到 峰值 为 1V， 那 么 ， 最 高 声音 信号 被 编码 为 1V， 而 最 低 声 音 等 于 
1/65 536V， 这 得 出 的 允许 动态 范围 近似 于 96dB( 分 贝 )。 所 以 在 多 媒体 个 人 计算 机 的 中 、 高 档 
声卡 一 般 为 了 获得 较 好 采样 音质 往往 选用 字 长 16 位 或 32 We 


2. 采样 精度 


在 数字 化 系统 中 ， 表 示 每 个 声音 样本 值 所 用 的 二 进 制 位 a 
度 。 例如， 每 个 声音 样本 用 16 位 (2 字 节 ) 表 示 ， 测 得 的 吾 样 本 信 为 0 一 65 536， 它 的 精度 就 
是 输入 信号 的 1/65 536。 tp gt 位 数 越 多 ， 声 音 的 质量 越 高 ， 


而 需要 的 存储 空间 也 越 多 ; 越 少 ， 声 越 低 ， 需 要 的 存储 空间 就 越 少 。 
采样 精度 的 另 - i 号 噪 二 mie to-noise ratio, SNR 或 S/N)， 


并 用 下 式 计算 : WX 
SNR= 10Jogl(iwa) Co 风 局 20eR (ro) 
其 中 ，Vigna 表示 信号 电 “表示 噪声 电压 ; SNR 的 单位 为 分 贝 dB)。 

假设 Vioise 二 1, 采样 湖 度 为 1 位 ， 表 示 为 Vig 二 21， 它 的 信 噪 比 SNR 二 6dB。 

假设 Viose 二 1; 采样 精度 为 16 位， 表示 为 Vsww 二 26， 它 的 信 品 比 SNR 一 96dB。 

一 般 来 说 ， 比 越 大 ， 说 明 混在 信号 旱 的 噪声 越 小 ， 声音 回放 的 音质 量 越 高 ， 否 则 相 
反 。 信 品 比 一 般 不 应 该 低 于 704B， 高 保 真 音箱 的 信 品 比 应 达到 110dB 以 上 。 

通过 对 本 节 内 容 的 学 习 ， 可 以 得 出 如 下 结论 。 

(1) 采样 率 和 字 长 是 影响 声音 数字 化 质量 的 两 个 重要 技术 指标 。 采 样 率 决 定 了 系统 可 记录 
声音 的 范围 ， 按 照 采样 理论 ， 系 统 应 选择 高 于 所 录 声 音频 带 二 倍 作为 采样 率 ， 如 记录 自然 声 
音 ( 语 音 、 音 乐 等 ) 应 选择 44.1kHz 的 采样 率 ， 若 只 记录 语音 ， 则 可 选择 11.025kHz 的 采样 率 便 
可 保证 无 失真 。 

采样 的 字 长 决定 了 量化 的 精确 度 ， 以 44.1kHz，16 位 字 长 采样 ， 其 录制 的 音质 可 达到 CD 
立体 声 的 音质 水 准 。 

(2) 0 Nn 需 存储 的 声音 数据 就 越 多 ， 系 统 的 开销 就 越 大 。 
(3) 衡量 声音 性 能 还 需 综合 其 他 因素 ， 如 MIDI 等 。 


2.3.3 ”编码 


数字 化 的 波形 声音 是 一 种 使 用 二 进 制 表示 的 串 行 的 比特 流 (bit torrent), 它 遵 循 一 定 的 标准 
或 规范 进行 编码 ， 其 数据 是 按时 间 顺 序 组 织 的 。 波 形声 音 的 主要 参数 包括 采样 频率 、 采 样 精 
度 、 声 道 数目 。 使 用 的 压缩 编码 方法 及 比特 率 (bit rate), 也 称 为 码 率 , 它 指 的 是 每 秒 的 数据 量 。 
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下 数字 声音 未 压缩 前 ， 波 形声 音 存储 量 的 计算 公式 为 


存储 量 =( 采 样 频率 X 量 化 位 数 X 声 道 数 )/8(B) 

例如 ， 数 字 激 光 唱 盘 的 标准 采样 频率 为 44.1 kHz ， 量 化 比特 数 为 16b， 立 体 声 ， 它 可 以 
几乎 无 失真 地 播 出 频率 高 达 22kHz 的 声音 ， 这 也 是 人 类 所 能 听 到 的 最 高 频率 声音 。 存 储 Imin 
音乐 数据 所 需要 的 容量 为 44.1X1000X16X2X60/8 王 10 584 000(B)。 
由 于 声音 的 数字 化 ， 将 有 大 量 的 数据 存储 到 计算 机 ， 若 对 这 些 音频 数据 不 加 编码 压缩 ， 
则 很 难 在 个 人 计算 机 上 实现 多 媒体 功能 。 例 如 ，1 个 100MB 的 存储 空间 只 能 存储 10min 
44.1kHz、16 位 、 双 声 道 的 立体 声 录 音 。 由 此 可 见 ， 高 效 、 实 时 地 压缩 音频 信号 的 数据 量 是 多 
媒体 计算 机 不 可 回避 的 关键 技术 问题 之 一 。 
数据 压缩 之 所 以 可 以 实现 是 因为 原始 的 信 源 数据 (音频 信号 或 音频 数据 ) 存 在 着 很 大 的 宛 
余 度 ， 另 外 ， 由 于 人 类 听觉 的 生理 特性 ， 即 只 能 对 20Hz 一 20kHz 范围 内 的 声音 可 听 到 ， 其 他 
范围 内 即便 有 声音 也 听 不 到 ， 因 而 可 实现 高 压缩 比 。 给 

自 1948 年 Oliver 提出 PCM 编码 理论 开始 , 至今 人 2: CN 史 。 随 着 数字 通信 技术 
和 计算 机 科学 的 发 展 ， 编 码 技术 日 下 成 熟 ， 应 用 范围 钨 编码 方案 基本 可 分 为 有 损 
压缩 和 无 损 压 缩 两 大 类 。 采 用 何 种 编码 方法 与 应 用 领域 生计 卡 及 相关 软件 有 关 。 
在 目前 个 人 计算 机 上 常用 的 声卡 中 有 ed 码 调制 方案 、k 律 /A 律 等 ， 以 自 适 
应 差分 脉冲 码 调制 编码 方案 为 例 ， 它 能 以 4。 的 压缩 比 压缩 音频 数据 。 但 这 种 算法 是 一 种 有 
失真 的 压缩 ， 压 ee 将 引起 信号 的 衰减 ， 一 个 16 位 立体 声 信号 
编码 /解码 后 结果 由 原先 的 96dB yw SA 相当 于 将 接近 CD 的 质量 降 到 了 AM 无 线 的 音 
质 。 为 了 提高 多 媒体 计算 机 对 语 入 的 实时 处 理 能 力 着 1993 年 起 出 现 了 基于 数字 信号 
处 理 器 的 声卡 平台 .这 引起 了 福 ee 音 部 技术 方面 4 个 有 重大 意义 的 技术 的 出 
现 。 它 介 人 是 合成 、 声 音 压 缩 子 程序 和 Qsound 三 维 声音 。 这 些 技术 的 共同 
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点 是 利用 计算 机 强度 算法 ， 而 这 个 红 兴 入 结构 的 、 功 能 强大 的 微 处 理 器 去 实时 运 
行 ，DSP 便 起 了 样 的 作用 。 下 Ke 
2.3.4 ”声音 的 

经 由 数字 化 声音 的 3 步骤 : 采样、 量化 和 编码 ， 得 到 的 是 便于 计算 机 处 理 的 数字 语音 信 














， 若 要 重新 播放 数字 化 声音 ， 还 必须 要 经 过 解码 、D/A 转换 和 插值 ， 其 中 ， 解 码 是 编码 的 逆 
3 又 称 解 压缩 :; D/A 转换 是 将 数字 量 再 转化 为 模拟 量 便 于 驱动 扬声器 发 音 ， 插值 是 为 了 
弥补 在 采样 过 程 中 引起 的 语音 信号 失真 而 采取 的 一 种 补救 措施 ， 使 得 声音 更 加 自然 , 如 图 2.6 

给 出 了 声音 重 构 的 一 般 过 程 。 



























数 子 谨 频 横扫 训 频 
图 2.6 声音 重 构 的 一 般 过 程 


2.4 声音 文件 的 存储 格式 





如 同 存储 文本 文件 一 样 ， 存储 声音 数据 也 需要 有 存储 格式 。 在 nternet 上 和 各 种 机 器 上 运 
行 的 声音 文件 格式 很 多 ,但 目前 比较 流行 的 有 以 .wav (waveform)，.au(audio)，.aiff(Audio 


Be 
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Interchangeable File Format) 和 .snd(sound) 为 扩展 名 的 文件 格式 。.wav 格式 主要 用 于 PC，.au 主 
要 用 于 UNIX 工作 站 ，.aiff 和 .snd 主要 于 在 苹果 机 和 美国 视 算 科技 有 限 公 司 (Silicon Graphics， 
Inc.，SGD 的 工作 站 。 

以 .wav 为 扩展 名 的 文件 格式 称 为 波形 文件 格式 (WAVE File Format), 它 在 多 媒体 编程 接口 
和 数据 规范 1.0(Multimedia Programming Interface and Data Specifications 1.0) 文 档 中 有 详细 的 
描述 。 该 文档 早已 由 IBM 和 Microsoft 公司 联合 开发 出 来 了 ， 它 是 一 
种 为 交换 多 媒体 资源 而 开发 的 资源 交换 文件 格式 (Resource Interchange 
File Format, RIFF). 

波形 文件 格式 支持 存储 各 种 采样 频率 和 样本 精度 的 声音 数据 ， 
并 支持 声音 数据 的 压缩 。 波 形 文件 有 许多 不 同类 型 的 文件 构造 块 组 
成 , 其 中 主要 的 两 个 文件 构造 块 是 格式 块 (Format Chunk) 和 声音 数据 
块 (Sound Data Chunk)。 格式 块 包含 有 描述 波形 的 重 要 参数 ， 如 采样 
频率 和 样本 精度 等 , 声音 数据 块 则 包含 有 实际 的 波形 声 音 数据 RIFF. 
中 的 其 他 文件 块 是 可 选择 的 。 它 的 简化 结构 如 图 2.7 所 示 。 i 2-4 
列 出 了 部 分 声音 文件 的 扩展 名 。 时 


表 2-4 a 



























































Group ID= “RIFF’ 
Riff Type= “WAVE’ 





























文件 的 扩展 名 \ 
au -SUN 和 NeXT 公司 的 声音 文件 存储 
aif(Audio Interchange Apple 计算 机 上 的 声音 文件 存储 格式 
cmf(Creative Music Format 声卡 带 的 MIDI 交 习 存 储 格式 
mct $7 MIDI 文件 存储 格式 
mff(MIDI Files Format MIBI 文件 存储 格式 
mid(MIDI Winhdows 的 MIDI 文件 存储 格式 
mp2 三 MPEG LayerI 及 MPEG Layer II 
mp3 \ y MPEG Layer IIT 
mod(Module MIDI 文件 存储 格式 
rm(Real Media RealNetworks 公司 的 流放 式 声音 文件 格式 
ra(Real Audio RealNetworks 公司 的 流放 式 声音 文件 格式 
rol Adlib 声音 卡 文件 存储 格式 
snd(sound) Apple 计算 机 上 的 声音 文件 存储 格式 
seq, MIDI 文件 存储 格式 
sng MIDI 文件 存储 格式 
voc(Creative Voice) 声卡 存储 的 声音 文件 存储 格式 
wav(Waveform)* Windows 采用 的 波形 声音 文件 存储 格式 
wrk Cakewalk Pro 软件 采用 的 MIDI 文件 存储 格式 


注 : * 支 持 PCM、ADPCM、hh 率 和 A 率 波形 


2.5” ”MIDI 音乐 


数字 音频 实际 上 是 一 种 数字 式 录音 / 重 放 的 过 程 ， 需 要 很 大 的 数据 量 。 波 形声 音 也 可 以 表 
示 音 乐 ， 但 并 没有 将 它 看 作 音乐 。 由 于 音乐 是 完全 可 以 用 符号 来 表示 的 ， 所 以 音乐 可 看 作 符 
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an 下 多 巡 订 技术 及 其 应 用 (第 版) 

_ 一 号 化 的 声音 媒体 。 在 音乐 的 制作 中 还 有 一 项 重要 技术 ， 它 完全 不 同 于 原来 的 录音 技术 ， 而 是 
直接 通过 计算 机 合成 的 方式 来 创作 音乐 , 这 就 是 电子 乐器 数字 接口 ( Musical Instrument Digital 
Interface，MIDI ) 技 术 。 


2.5.1 MIDI 简介 











MIDI 是 人 音乐 合成 器 (Music Synthesizers)、 乐 器 (Musical Instruments) 和 计算 机 之 间 








交换 音乐 信息 的 一 种 标准 协议 。 由 于 MIDI 技术 也 是 利用 计算 机 来 处 理 信息 并 产生 乐音 的 一 
种 技术 ， ei MIDI 技术 与 数字 音频 技术 是 两 种 非常 容易 混淆 的 技术 ,但 实际 上 这 是 两 种 不 
同 的 技术 。 





与 数字 音频 不 同 ，MIDI 的 数据 信息 不 是 声音 信息 的 数字 化 记录 。MIDI 数据 主要 是 电子 
合成 器 上 键盘 按键 状况 的 数字 化 记录 ， 主 要 包括 按 了 哪 一 个 键 、 音 高 、 力 度 多 大 、 持 续 时 间 
多 长 、 键 释放 等 控制 信息 。MIDI 的 这 些 数字 信息 不 能 通过 D/A 换 直接 转换 成 声音 ， 只 能 
通过 MIDI 设备 的 音源 来 读 取 MIDI 消息 ， We 合成 器 生成 音乐 
声波 ， 经 放大 后 由 扬声器 播 出 。 
从 20 世纪 80 年 代 初期 开始 ，MIDI 已 经 逐步 被 by - 泛 接受 和 使 用 。MIDI 
是 乐器 和 计算 机 使 用 的 标准 语言 。 MIDI 标准 之 所 以 受到 欢迎 ， 主要 是 它 有 下 列 几 个 优点 : 
生成 的 文件 比较 小 ， 因 为 MIDI ee 而 不 是 声音 波形 ， 容 易 编辑 ， 因 为 编辑 
命令 比 编辑 声音 ee NS 乐 ， 因 为 MIDI 音乐 可 以 和 其 他 的 媒体 ， 如 
数字 电视 、 图 形 、 动 画 、 话 音 和 0 \ 过 样 可 以 加 强 演示 效果 。 


2.5.2 MIDI 相关 的 术语 。 一 xz 议 矿 


在 介绍 MIDI 技术 之 前 ， 驳 了 解 一 下 与 ee - 些 专业 术语 。 

1) MIDI 消 息 (Message) 或 指令 

乐谱 的 一 种 记录 烙 式 ， 相 : 5 于 乐谱 语 请 0 也 称 为 消息 。 乐 谱 
由 音符 序列 、 定 了 合成 音色 的 乐器 定义 组 成 当 一 组 MIDI 消息 通过 音乐 合成 芯片 演奏 时 ， 
合成 器 解释 这 些 字符 ， 并 产生 音乐 。 如 果 按 下 键盘 ， MIDI 设备 将 记录 用 户 按 了 哪 一 个 键 、 
音 高 、 力 度 多 大 、 持 续 时 间 多 长 、 键 释放 等 控制 信息 ， 这 些 就 是 指令 。 

2) MIDI 文件 

MIDI 文件 是 存储 MIDI 消息 的 标准 文件 格式 , 其 扩展 名 为 “.mid”。 这 是 一 种 二 进 制 文件 ， 
不 是 文本 文件 ， 所 以 不 能 直接 打开 和 编辑 。 一 个 MIDI 文件 包含 两 部 分 ， 文件 头 和 音 轨 。 文 
件 头 描述 文件 的 类 型 和 音 轨 数 等 ， 音 轨 记 录 MIDI 数据 ， 其 中 ， 主 要 是 命令 序列 ， 每 个 命令 
包括 命令 号 、 通 道 号 、 音 色 号 和 音速 等 。 

3) 通道 

MIDI 文件 中 含有 几 种 乐器 的 组 合 音乐 , 各 种 乐器 由 于 音色 的 不 同 而 有 不 同 的 波形 , 波形 
经 各 自 通道 (Channel) 送 到 合成 器 ， 合 成 器 按 音 色 和 音调 的 要 求 合 成 ， 再 把 这 些 波形 都 混在 一 
起 生成 最 终 的 声音 。 合 成 器 的 通道 是 一 个 独立 的 信息 传输 路 线 ， 将 单个 物理 通道 (可 以 理解 为 
数据 传输 电缆 ) 分 成 16 个 逻辑 通道 ， 每 个 通道 相当 于 一 个 逻辑 上 的 合成 器 ， 可 以 充当 一 种 乐 
器 。MIDI 可 为 16 个 通道 提供 数据 。 每 个 通道 访问 一 个 独立 的 逻辑 合成 器 。 

4) 音 序 器 

音 序 器 (Sequencer) 又 称 声音 序列 发 生 器 ， 是 为 MIDI 作曲 而 设计 的 计算 机 程序 或 电子 装 
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置 ， 用 来 记录 、 播 放 和 编辑 MIDI 音乐 数据 。 音 序 器 有 硬件 形式 的 ， 也 有 软件 形式 的 。 音 序 
器 可 将 所 有 MIDI 通道 中 的 演奏 信息 同时 自动 播放 演奏 。 这 样 ， 一 个 人 就 可 完成 相当 于 一 个 
乐队 的 多 声 部 演奏 和 录音 任务 。 硬 件 的 音 序 器 是 一 种 非常 复杂 的 设备 ， 价 格 较 贵 。 现 在 ， 大 
多 被 软件 音 序 器 取代 ， 如 Cakewalk 就 是 一 款 流 行 的 音 序 器 软件 。 

5) 音乐 合成 器 

音乐 合成 器 (Musical Synthesizer) 是 利用 数字 信号 处 理 器 或 其 他 集成 电路 芯片 来 产生 音乐 

或 声音 的 电子 装置 。 数 字 信号 处 理 器 产生 并 修改 波形 ， 然 后 通过 声音 产生 器 和 扬声器 发 出 特 
定 的 声音 。 合 成 器 的 播放 效果 很 丰富 ， 并 且 其 特点 体现 在 ; 弹 奏 的 是 一 种 乐器 而 播放 的 却 是 
另 一 种 乐器 的 声音 ， 并 且 几 种 不 同 乐器 的 声音 经 合成 器 合成 后 可 同时 播放 。 目 前 合成 器 芯片 
产生 声音 的 手段 主要 有 FM 合成 和 波形 表 合 成 两 种 。 
6) MIDI 电子 乐器 
MIDI 电子 乐器 不 是 特 指 某 一 架 电子 乐器 , 而 是 指 合成 器 可 以 根据 指令 合成 出 许多 不 同音 
色 的 声音 ， 如 钢琴 、 鼓 、 中 提琴 。 不 同 的 合成 器 ， 乐 器 音 号 相同 ; 声音 的 质量 也 不 同 ， 如 
多 个 数字 乐器 都 能 合成 钢琴 的 声音 ， i 它们 输出 的 声音 有 差异 。 
7 复 音 
音 (Polyphony) 是 指 合成 器 同时 演奏 若干 音 音符 1 乔 计 作出 的 声 间 音 。 如 钢琴 、 吉 他 等 乐器 可 以 
同时 演奏 几 种 音符 ， 而 双簧 管 2 CO Re 符 数 ， 如 钢琴 的 和 弦 音 符 。 
早期 的 合成 器 是 单 音调 的 ， 即 一 个 音 ， 任 任用 户 在 键盘 上 按 多 少 键 它 只 能 



















































































放下 音 ， 一 个 24 敌人 eu Cr 
户 一 下 子 在 钢琴 上 按 24 个 键 ,外 ,、 x 和 
8) 音色 r ?AAA 


音色 取决 于 声 : 音 的 频 洲 结 构 。 CR ER 
如 低音 提琴 、 钢 琴 * 有 和 

9) 多 音色 

多 关公 0 Nb 条 癌 时 并 尖 几 补 趟 同 东 凡 上 出 的 省 ， 它 着 重 于 同时 演奏 的 乐器 
数 。 例 如 ， 具 有 6 音符 复 音 的 4 种 乐器 合成 器 ， 可 以 同时 演奏 4 种 不 同 声音 的 6 个 音符 ， 如 
3 个 钢琴 的 和 弦 音 符 、 一 个 长 笛 、 一 个 小 提琴 和 一 个 萨克斯 管 的 音符 。 要 改善 合成 音乐 的 真 
实感 ， 必 须 把 许多 合成 器 连接 起 来 ， 以 产生 复 音 和 多 音色 声音 。 

10) 音 轨 

音 轨 是 一 种 用 通道 把 MIDI 数据 分 割 成 单独 组 、 并 行 组 的 文本 概念 。 音 序 器 像 磁带 记录 
声音 那样 将 接收 到 的 MIDI 文件 录入 文件 的 不 同位 置 ， 这 些 位 置 就 称 作 音 轨 。 通 常 ， 每 个 通 

一 个 单独 的 音 轨 。 

11) 合成 音色 映射 器 

合成 音色 映射 器 是 一 种 软件 ， 为 了 适应 Microsoft MIDI 合成 音色 ， 分 配 表 规定 合成 音色 
编号 。 软 件 要 为 特定 的 合成 器 重新 分 配乐 器 合成 音色 编号 ， 多 媒体 Windows 的 映射 器 可 将 乐 
器 的 合成 音 映 射 到 任意 MIDI 装置 上 。 

12) 通道 映射 

通道 映射 把 发 送 装 置 的 MIDI 通道 号 变换 成 适当 的 接收 装置 的 通道 号 。 例 如 ， 编 排 在 10 
号 通道 的 鼓乐 ， 对 于 仅 接 收 6 号 通道 的 鼓 来 说 ， 就 被 映射 成 6 号 通道 。 
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一 13) MIDI 键 盘 


一 多 若 你 度 林 及 站 应 用 (第 县 ) 


MIDI 键盘 是 用 于 MIDI 音乐 乐曲 演奏 创作 的 ，MIDI 键盘 本 身 并 不 发 出 声音 ， 当 触动 键 
盘 上 的 按键 时 ， 它 发 出 按键 信息 ， 所 产生 的 仅仅 是 MIDI 音乐 消息 ， 从 而 由 音 序 器 录制 生成 
MIDI 文件 。 这 些 数据 可 以 进一步 加 工 ， 也 可 以 和 其 他 的 MIDI 数据 合并 ， 经 编辑 后 的 MIDI 
文件 就 可 送 合成 器 播放 。 
14) MIDI 接口 
MIDI 硬件 通信 协议 ， 可 使 电子 乐器 互 连 或 与 计算 机 硬件 端口 相连 ， 可 发 送 和 接收 MIDI 


2.5.3 ”MIDI 音乐 合成 方法 


产生 MIDI 乐音 的 方法 很 多 ， 现 在 用 得 较 多 的 方法 有 两 种 : 一 种 是 FM(Frequency 
Modulation， 频 率 调制 ) 合 成 法 ， 另 一 种 是 乐音 样本 合成 法 ， 电信 2 (Wavetable) 合 成 
法 。 这 两 种 方法 目前 主要 用 来 生成 音乐 。 

1，FM 合成 法 AN \ 

音乐 合成 器 的 先驱 Robert Moog 采用 Tm 了 复杂 的 乐音 。20 世纪 80 年 代 
初 ， 美 国 斯 坦 福 大 学 (Stanford University) 的 一 个 名 汶 John Chowning 的 研究 生发 明了 一 种 产生 
乐音 的 新 方法 , 这 种 方法 称 为 数字 式 频 率 调制 合成 法 (Digital Frequency Modulation Synthesis)， 
简称 为 FM 合成 器 。 他 把 几 种 乐音 的 波形 用 数字 来 表达 ， 并 且 用 数字 计算 机 而 不 是 用 模拟 电 
子 器 件 把 它们 组 合 起 来 ， pe to Analog Convertor，DAC) 来 生成 乐音 。 斯 
坦 福 大 学 得 到 了 发 明 专 利 ， 并 且 权 授 给 Yamaha 公司 ;该 公 N 司 把 这 种 技术 做 在 集成 电 
路 芯片 里 ， 成 了 世界 市 场 - ] 产 品 。 合成 法 的 发 明 使 全 成 音乐 产业 发 生 了 一 次 革命 。 

FM 合成 器 生成 乐 BN 原理 如 图 站 所 未» 它 由 5 个 基本 模块 组 成 数字 载波 器 、 调 
制 器 、 声 音 包 络 发 生 器 、 字 运 算 器 和 模 数 转换 。 数字 载波 器 用 了 3 个 参数 : 音调 (Pitch)、 
WAN Re 调制 器 用 了 6 个 参数 ， 频 率 (Frequency)、 调 制 深度 (Depth)、 












































波形 的 类 型 (T 站 馈 量 (Feedback)、 颤音 (Vibrato) 和 音 音效 (Effect);， 乐器 声音 除了 有 它 自 己 
的 波形 参数 外 ,还 有 它 自己 的 比较 典型 的 声音 包 络 线 ， 声音 包 络 发 生 器 用 来 调制 声音 的 电 平 ， 
这 个 过 程 也 称 为 幅度 调制 (Amplitude Modulation，AM)， 并 且 作 为 数字 式 音量 控制 旋钮 ， 它 的 
4 个 参数 写成 ADSR， 这 条 包 络 线 也 称 为 音量 升降 维持 静音 包 络 线 。 

在 乐音 合成 器 中 ， 数 字 载 波 波形 和 调制 波形 有 很 多 种 ， 不 同型 号 的 FM 合成 器 所 选用 的 
波形 也 不 同 。 图 2.9 是 Yamaha OPL-III 数字 式 FM 合成 器 采用 的 波形 。 
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图 2.8 FM 声音 合成 器 的 工作 原理 图 2.9 声音 合成 器 的 波形 
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各 种 不 同 乐音 的 产生 是 通过 组 合 各 种 波形 和 各 种 波形 参数 ， 并 采用 各 种 不 同 的 方法 实现 
的 。 用 什么 样 的 波形 作为 数字 载波 波形 、 用 什么 样 的 波形 作为 调制 波形 、 用 什么 样 的 波形 参 
数组 合 才能 产生 所 希望 的 乐音 ， 这 就 是 FM 合成 器 的 算法 。 

通过 改变 图 2.8 中 所 示 的 参数 ， 可 以 生成 不 同 的 乐音 ， 例 如 

(1) 改变 数字 载波 频率 可 以 改变 乐音 的 音调 ， 改 变 它 的 幅度 可 以 改变 它 的 音量 。 

(2) 改变 波形 的 类 型 ， 如 用 正弦 波 、 半 正弦 波 或 其 他 波形 ， 会 影响 基本 音调 的 完整 性 。 

(3) 快速 改变 调制 波形 的 频率 ( 即 音调 周期 ) 可 以 改变 颤音 的 特性 。 

(4) 改变 反馈 量 ， 就 会 改变 正常 的 音调 ， 产 生 刺 耳 的 声音 。 

(5) 选择 的 算法 不 同 ， 载 波 器 和 调制 器 的 相互 作用 也 不 同 ， 生 成 的 音色 也 不 同 。 

在 多 媒体 计算 机 中 ，, 图 2.8 中 的 控制 参数 以 字 节 的 形式 存储 在 声音 卡 的 ROM 中 。 播 放 某 
种 乐音 时 ， 计 算 机 就 发 送 一 个 信号 ， 这 个 信号 被 转换 成 ROM 的 地 址 ， 从 该 地 址 中 取出 的 数 
据 就 是 用 于 产生 乐音 的 数据 。 FM 合成 器 利用 这 些 数据 产生 的 乐音 是 否 真实 , 它 的 真实 程度 有 
多 高 ， 这 就 取决 于 可 用 的 波形 源 的 数目 、 算 法 和 波形 的 类 型 .< < 

a SS 

2. 波形 表 合成 法 < \ 

使 用 FM 个 成 法 玉 产 生 各 种 反 直 的 乐音 是 相当 全 闪光 | 有 此 乐音 几乎 不 能 产生 ， 因 此 和 
lb der eg tard ert CN ma ol 
播放 时 改变 播放 速度 ， 从 而 改变 音调 周期 从 成 各 种 音阶 的 音符 。 

乐音 样本 的 采集 相对 比较 直观 。 音 乐 家 在 真实 乐器 上 演奏 不 同 的 音符 ， 选 择 采 样 频率 为 
44.1kHz、16b 量化 的 乐音 样本 ， 这 相当 ; “ CD-DA 的 质量 ,把 不 同音 符 的 真实 声音 记录 下 来 ， 
这 就 完成 了 乐音 样本 的 采集 。 必 波形 表 ” 合 成 法 是 当今 使 用 最 广泛 的 一 种 音乐 合成 技术 。“ 波 
人 
样本 。 例 如 ， 钢 琴 声音 样 就 是 把 真实 钢琴 的 志 光 录制 下 玉 存 储 成 波形 文件 ， 如 果 沉 要 演 认 
“钢琴 ”音色 ,合成 蕊 片 就 会 把 这 些 样本 播放 汕 来 > 由 于 这 些 样本 本 来 就 是 真实 乐器 录制 成 的 
所 以 效果 也 非常 怠 真 。 一 个 MIDI 设备 通常 包含 多 种 乐器 的 声音 ， 而 一 个 乐器 又 往往 需要 多 
个 样本 ， 所 以 把 这 些 样本 排列 起 来 形成 一 个 表格 以 方便 调用 。 这 就 称 之 为 波形 表 ， 简称 波 表 。 

在 实际 中 ， 常 有 “ 软 波 表 ” 和 “ 硬 波 表 ”之 称 。 其 实 ,“ 波 表 ” 本 无 软 硬 之 分 ， 之 所 以 这 
样 分 是 有 一 定 历史 原因 的 。 在 个 人 计算 机 的 整体 性 能 (特别 是 CPU 速度 ) 还 不 够 高 时 ， 波 表 技 
术 只 能 够 通过 专门 的 DSP 芯片 来 完成 。 这 些 专门 的 DSP 芯片 就 构成 了 那些 专业 硬件 设备 ， 如 
音源 、 合 成 器 等 。 而 当 个 人 计算 机 迈 入 奔腾 时 代 以 后 ， 其 处 理 速度 已 经 足够 快 ， 可 以 实时 处 
理 波 表 数 据 ， 所 以 ， 当 时 就 出 现 了 靠 计算 机 CPU 来 运算 的 “ 软 波 表 ”， 由 此 可 见 ,“ 软 波 表 ” 
就 是 靠 CPU 来 运算 的 波 表 技术 ， 除 此 之 外 的 都 称 作 “ 硬 波 表 ”( 无 论 是 在 声卡 上 还 是 在 专用 
设备 上 )。“ 硬 波 表 ” 的 乐音 样本 通常 放 在 ROM 芯片 上 , ROM 是 超大 规模 集成 电路 (Very Large 
Scale Integrated，VLSD 芯 片 。 使 用 乐音 样本 合成 器 的 原理 框图 ， 如 图 2.10 所 示 。 

波形 表 合成 法 的 主要 技术 指标 如 下 。 

(1) 最 大 复 音 数 。 最 大 复 音 数 直 接 由 计算 机 的 处 理 能 力 来 决定 ,以 现在 计算 机 的 处 理 速度 
来 说 ，32 甚至 是 64 复 音 数 是 没有 多 大 问题 的 ， 这 对 于 普通 的 MIDI 文 件 来 说 也 是 足够 了 。 

(2) 波形 容量 。 就 是 所 有 波形 样本 的 总 容量 大 小 。 很 明显 ， 波 形容 量 越 大 ， 所 容纳 的 波形 
样本 也 就 越 多 ， 所 模仿 的 乐器 音色 也 就 越 真实 。 通 常 ， 软 波 表 的 波形 容量 大 都 是 4~8MB。 

(3) 波形 的 采样 质量 。 即 录制 样本 所 采用 的 数字 录音 格式 。 一 般 的 专业 设备 ， 其 采样 质量 
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i 多 媒体 技术 及 其 应 用 (第 2 版 ) 
一 都 是 16b、44.1kHz( 或 者 48kHz)， 即 相当 于 普通 CD 的 质量 。 
一 颤音 
一 合奏 
声音 一 一 回声 回荡 
一 移动 立体 声 源 
a 右 通道 
改变 播放 速率 ， 加 音效 ， 加 人 
音量 一 | 使 用 包 络 数据 , 等 等 
HN 左 通 道 
Attack: 音量 提升 速度 
A R | Decay: 音量 下 降 速度 
Sustain: 乐音 维持 强度 
声音 包 络 发 生 器 。 | eese 声音 回 零 速度 


图 2.10 乐音 样本 合成 器 的 工作 原理 “<” 
2.5.4 “电子 乐器 数字 接口 (MIDD 系 统 TAY 


MIDI 协议 提供 了 一 种 标准 的 和 有 效 的 方法 ,用 来 把 演奏 信息 转换 成 电子 数据 。MIDI 信 
息 是 以 “MIDI messages ”传输 的 ， 它 可 以 被 认为 是 告诉 音乐 合成 器 (Music Synthesizer) 如 何 演 
奏 一 小 段 音乐 的 一 种 指令 ， 而 合成 器 把 接收 到 的 MIDI 数据 转换 成 声音 。 国 际 MIDI 协会 
(International MIDIAssociation) 出 版 的 MIDIT0 规范 对 MIDI 协议 做 了 完整 的 说 明 。 

MIDI 数据 流 是 单 向 异步 的 数据 位 流 (bit stream)， 其 速率 为 31.25 kb/s， 每 个 字 节 为 10 位 
(1 位 开始 位 ，8 位 数据 位 和 工 位 停止 位 )。MIDI 数据 流通 常 由 MIDI 控制 器 (MIDI Controller) 
产生 ， 如 乐器 键盘 (Musical Instrument Keyboard)， 或 者 由 MIDI 音 序 器 (MIDI Sequencer) 产 生 。 
MIDI 控制 器 是 当 作乐 器 使 用 的 一 种 设备 ， 在 播放 时 把 演奏 转换 成 实时 的 MIDI 数据 流 ，MIDI 
音 序 器 是 一 种 装置 ， 驳 许 MIDI 数据 被 捕获 > 存储、 编辑 、 组 合 和 重奏 。MIDI 乐器 上 的 MIDI 
接口 通常 包含 分 种 不 同 的 MIDI 连接 器 ， 用 让 (输入 )、OUT( 输 出 ) 和 THRU( 穿 越 )。 来 自 MIDI 
控制 器 或 者 音 序 器 的 MIDI 数据 输出 通过 该 装置 的 MIDI OUT 连接 器 传输 。 

通常 ，MIDI 数据 流 的 接收 设备 是 MIDI 声音 发 生 器 (MIDI Sound Generator) 或 者 MIDI 声 
音 模块 (MIDI Sound Module)， 它 们 在 MIDI IN 端口 接收 MIDI 信息 (MIDI Messages)， 然 后 播 
放声 音 。 图 2.11 表示 的 是 一 个 简单 的 MIDI 系统 ， 它 由 一 个 MIDI 键盘 控制 器 和 一 个 MIDI 
声音 模块 组 成 .许多 MIDI 键盘 乐器 在 其 内 部 既 包 含 键盘 控制 器 , 又 包含 MIDI 声音 模块 功能 。 
在 这 些 单元 中 ， 键 盘 控制 器 和 声音 模块 之 间 已 经 有 内 部 链接 ， 这 个 链接 可 以 通过 该 设备 中 的 
控制 功能 (Local Control) 对 链接 打开 (ON) 或 者 关闭 (OFF)。 





















IMIDI OUT MIDI IN 





w=— | 国 交 上 = 
| b 
ANN Wee 
MIDI Keybhoand Corvoller MIDI 声 音 模 块 ) 
(MIDI 键 盘 控制 器 ) 


图 2.11 简单 的 MIDI 系统 


42 


章 . 有， . 


| Ee wy 
单个 物理 MIDI 通道 (MIDI 0 并 个 逻辑 通道 ， 每 个 逻辑 通道 可 指定 一 种 乐器 ， 
音乐 键盘 可 设置 在 这 16 个 通道 之 中 的 任何 一 个 ， 而 MIDI 声 源 或 者 声音 模块 可 被 设置 在 指定 
的 MIDI 通道 上 接收 。 
在 一 个 MIDI 设 备 上 的 MIDI TN 连接 器 接收 到 的 信息 可 通过 MIDI THRU 连接 器 输出 到 另 
一 个 MIDI 设备 ， 并 可 以 菊花 链 的 方式 连接 多 个 MIDI 设备 ， 这 样 就 组 成 了 一 个 复杂 的 MIDI 
系统 ， 如 图 2.12 所 示 。 在 这 个 例子 中 ，MIDI 键盘 控制 器 对 MIDI 音 序 器 (MIDI Sequencer) 来 
说 是 一 个 输入 设备 ， 而 音 序 器 的 MIDI THRU 端口 连接 了 几 个 声音 模块 。 作 曲 家 可 使 用 这 样 
的 系统 来 创作 几 种 不 同 乐音 组 成 的 曲子 ， 每 次 在 键盘 上 演奏 单独 的 曲子 。 这 些 单独 曲子 由 音 
序 器 记录 下 来 ， 然 后 音 序 器 通过 几 个 声音 模块 一 起 播放 。 每 一 曲子 在 不 同 的 MIDI 通道 上 播 
放 ， 而 声音 模块 可 分 别 设置 成 接收 不 同 的 曲子 。 例 如 ， 声 音 模 块 #1 可 设置 成 播放 钢琴 声 并 
在 通道 1 接收 信息 ,模块 机 设置 成 播放 低音 并 在 通道 5 接收 信息 ,而 模块 #3 设置 成 播放 鼓乐 
器 并 在 通道 10 上 接收 消息 等 。 在 图 2.12 中 使 用 了 多 个 声音 模块 同时 分 别 播放 不 同 的 声音 信 
息 。 这 些 模块 也 可 以 做 在 一 起 构成 一 个 称 为 多 音色 的 声 音 模块 < 他 尘 可 以 起 到 同时 接收 利 
播放 多 种 声音 的 作用 。 RY 







































































































































































/ 图 2.12 复杂 MIDI 系统 
2.13 是 用 PC 构造 的 MIDI 系统 ， 该 系统 使 用 的 声音 模块 就 是 这 样 一 种 单独 的 多 音色 












































模块 。 在 这 个 系统 中 ，PC 使 用 内 置 的 MIDI 接口 卡 ， 用 来 把 MIDI 数据 发 送 到 外 部 的 多 
音色 MIDI 合成 器 模块 。 像 多 媒体 演示 程序 、 教 育 软件 或 者 游戏 等 应 用 软件 ， 它 们 把 信息 通 
过 PC 总 线 发 送 到 MIDI 接口 卡 。MIDI 接口 卡 把 信息 转换 成 MIDI 消息 ， 然 后 送 到 多 音色 声 
音 模块 同时 播放 出 许多 不 同 的 乐音 , 如 钢琴 声 、 低音 和 鼓 声 。 使 用 安装 在 PC 上 的 高 级 的 MIDI 
音 序 器 软件 ， 用 户 可 把 MIDI 键盘 控制 器 (MIDI Keyboard Controller) 连 接 到 MIDI 接口 卡 的 
MIDIIN 端口 ， 也 可 以 有 相同 的 音乐 创作 功能 

使 用 PC 构造 MIDI 系统 可 以 有 不 同 的 方案 。 例 如 ， 可 把 MIDI 接口 和 MIDI 声音 模块 组 
合 在 PC 添加 卡 上 。MPC 规范 就 要 求 PC 添加 卡 上 必须 有 这 样 的 声音 模块 ， 称 为 合成 器 
(Synthesizer)。 a 合成 器 称 为 FM 合成 器 (FM Synthesis)， 而 通 
过 存储 的 乐音 样本 来 产生 声音 的 合成 器 称 为 波 表 合成 器 (Wave Table Synthesis)。 

MPC 规格 需要 声音 人 二 色 和 多 音调 的 合成 器 。 多 音色 是 指 合成 器 能 够 同时 
播放 几 种 不 同 乐器 的 声音 ,在 英文 文献 里 常 看 到 用 voices 和 patches 来 表示 ， 音 色 就 是 把 一 个 
人 说 话 (或 一 种 乐器 ) 的 声音 与 男 一 个 人 说 话 (或 男 一 种 乐器 ) 的 声音 区 分 开 来 的 音 品 ; 多 音调 是 





f 下 二 
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一 一 “友基 应 首 (第) 
_ 指 合成 器 一 次 能 够 播放 的 音符 (note) 数 。MPC 规格 定义 了 两 种 音乐 合成 器 ， 基 本 合成 器 





(Base-level synthesizer) 和 扩展 合成 器 (Extended synthesizer)， 基 本 合成 器 和 扩展 合成 器 之 间 的 


差别 见 表 2-5。 


(synthesizer) 
基本 合成 器 
扩展 合成 器 


基本 合成 器 











典型 应 用 软件 2 MIDI IN | Audio Out 
提请 IE 
人 


Multitimbral 
Sound Module 
(多 音色 声音 模块 ) 
小 MIDI 接 山 卡 


带 功 举 放 人 器 的 扬声器 
图 2.13 使 用 PC 构成 的 MIDI 系统 
表 2.5 “基本 合成 器 和 扩展 合成 器 之 间 的 差别 
旋律 乐器 声 (melodic instruments) | 一 打击 乐器 声 (percussive instruments) 


音色 数 (timbres) 音调 数 (pofyphony) 音色 数 (timbres) 音调 数 (polyphony) 
3 种 音色 3 个 音符 
9 种 音色 NM16 个 音符 8 种 音色 16 个 音符 


必须 具有 同时 播放 了 种 旋律 音色 和 3 种 打 请 党 色 (鼓乐 ) 的 能 力 , 而 且 还 必须 具 



















有 同时 播放 6 个 旋律 音符 和 3 个 打击 音符 的 能 力 ，, 因 此 二 基本 合成 器 具有 9 种 音调 ， 扩 展 合 


成 器 要 能 够 同时 


数字 化 波形 
储 的 立体 声 高 保 
对 数字 波形 声音 

波形 声音 的 
语 之 间 的 停顿 )， 
声音 数据 压缩 算 

音频 信息 的 
有 损 压缩 法 又 可 
采样 和 量化 过 
根据 人 耳 的 听觉 
件 下 可 以 获得 高 
的 处 理 。 参 数 编 
参数 和 激励 信号 
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播放 所 种 旋律 音色 和 8 种 打击 音色 。 


Iy 


2.6 音频 信息 的 压缩 技术 


声音 的 数据 量 很 大 ， 数 字 语音 lh 的 数据 量 大 约 是 30MB， 而 CD 盘 片 上 所 存 
真 的 数字 音乐 了 的 数据 量 大 约 是 635MB。. 为 了 降低 存储 成 本 和 提高 通信 效率 
进行 数据 压缩 是 十 分 必要 的 。 

数据 压缩 也 是 完全 可 能 的 。 其 依据 是 声音 信号 中 包含 有 大 量 的 元 余 信息 (如 话 
再 加 上 还 可 以 利用 人 的 听觉 感知 特性 ， 因 此 ,产生 了 许多 压缩 算法 。 一 个 好 的 
法 通常 应 做 到 压缩 倍数 高 ,声音 失真 小 , 算法 简单 ,编码 器 /解码 器 的 成 本 低 。 
压缩 方法 有 多 种 ， 见 表 2-6。 无 损 压 缩 法 包括 不 引入 任何 数据 失真 的 焙 编 码 ， 
分 为 波形 编码 、 参 数码 和 同时 利用 这 两 种 技术 的 混合 编码 方法 。 波 形 编码 利 






































程 来 表示 音频 信号 的 波形 ， 使 编码 后 的 波形 与 原始 波形 尽 可 能 匹配 。 它 主要 
竺 性 进行 量化 ， 以 达到 压缩 数据 的 目的 。 波 形 编码 的 特点 是 在 较 高 码 率 的 条 





质量 的 音频 信号 ， 适 合 对 音频 信号 的 质量 要 求 较 高 和 高 保 真 语音 与 音乐 信号 
码 把 音频 信号 表示 成 某 种 模型 的 输出 ， 利 用 特征 提取 的 方法 抽取 必要 的 模型 
的 信息 ， 并 对 这 些 信息 编码 ， 最 后 在 输出 端 合成 原始 信号 。 参 数 编码 的 压缩 
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率 很 大 ， 但 计算 量 大 ， 保 真 度 不 高 ， 适 合 语音 信号 的 编 双 混合 编码 介 于 波形 编码 和 参数 纺 
码 之 间 ， 集 中 了 这 两 种 方法 的 优点 。 
表 2-6 音频 信号 压缩 方法 


























无 损 | Huffman 编码 
压缩 | 行程 编码 
| 全 频带 编码 、PCM、DPCM、ADPCM、MPEG-1、MPEG-2 及 AC-3 

波形 编码 | 子 带 编码 ， 自 适应 变换 编码 (ATC)， 心 理学 模型 
帮 | 矢量 量化 编码 
参数 编码 线性 预测 LPC 
缩 矢量 和 激励 线性 预测 VSELP 

混合 编码 多 脉冲 线性 预测 MP-LPC 

码 本 激励 线性 预测 CELP 








目前 在 几 种 常用 的 全 频带 声音 的 压缩 编码 方法 中 ， ‘MEG MPEG-2 和 杜 比 数字 AC-3 
应 用 得 更 为 普遍 。 其 中 ，MPEG-! 的 声音 压 缩编 码 标准 分 汶 3 个 层次 : 层 llayerl) 的 编码 较 简 
单 ， 主 要 用 于 数字 盒 式 录音 磁带 ; 层 2(layer2) 的 算法 复杂 度 中 等 ， 其 应 用 包括 数字 音频 广播 
(DAB) 和 VCD 等 ， 层 3(layer3) 的 编码 较 复杂 “主要 应 用 于 Intemet 上 高 质量 声音 的 传输 ， 如 
流行 的 “MP3 音乐 ”就 是 一 种 采用 MPEG:1 层 3 编码 的 高 质量 数字 音乐 ， 它 能 以 10 倍 左右 的 
奈 乔 比 降低 奋 保 各 数字 闫 省 和 的 存储 量 ;使 开张 普通 CD 入 100 首 MP3 歌曲 。 

MPEG-2 的 声音 压缩 采用 ， 与 MPEG-I 声 音 相同 的 编译 码 器 、 层 2 和 层 3 的 结构 
也 相同 ， 但 它 能 支持 5.1 
杜 比 数字 AC-3 是 美国 柱 比 实 给 室 开发 的 多 壕 道 全 频带 声音 编码 系统 , 它 提供 的 环绕 立体 
声 系 统 由 5 个 (或 7 个) 全 频带 声 道 加 - -个 超 低 音 声 道 组 成 , 所 有 声 道 的 信 作 和 还 原 过 和 
中 全 部 数字 化 息 损失 很 少 ， 细节 十 分 丰富 ， 具 有 真正 的 立体 声效 果 ， 在 数字 电视 、DVD 
和 家 庭 影院 中 广泛 使 用 。 

在 有 线 电话 通信 系统 中 ， 数 字 语 音 在 中 继 线 上 传输 时 采用 的 压缩 编码 方法 是 国际 电信 联 
盟 ITU 提出 的 G711 和 G.721 标准 ， 前 者 是 PCM( 脉 冲 编码 调制 ) 编 码 ， 后 者 是 ADPCM( 自 适 
应 差分 脉冲 编码 调制 ) 编 码 。 它 们 的 码 率 虽然 比较 高 (分 别 为 64kb/s 和 32kb/s)， 但 能 保证 语音 
的 高 质量 ， 且 算法 简单 、 易 实现 ， 多 年 来 在 固定 电话 通信 系统 中 得 到 了 广泛 应 用 。 由 于 它们 
采用 波形 编码 ， 便 于 计算 机 编辑 处 理 ， 所 以 在 计算 机 中 也 被 广泛 使 用 ， 如 多 媒体 课件 中 教员 
的 讲解 、 动 画 演示 中 的 配音 、 游 戏 中 角色 之 间 的 对 白 等 都 采用 ADPCM 编码 。 
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2.7 ”数字 语音 的 应 用 


声音 是 人 类 信息 交流 最 自然 的 一 种 方式 ， 随 着 声音 数字 化 技术 的 不 断 成 熟 ， 数 字 语音 的 
应 用 领域 日 趋 广泛 ， 人 机 交互 更 加 自然 ， 目 前 数字 语音 的 应 用 大 都 集中 在 语音 识别 和 语音 合 
成 两 个 方面 。 在 语音 识别 方面 目前 在 我 国 比较 成 功 的 应 用 是 汉字 的 语音 输入 ， 其 正确 率 可 达 
90% 以 上 。 而 文 一 语 转换 则 是 语音 合成 方面 一 个 较 有 发 展 前 途 的 应 用 。 本 节 将 介绍 语音 识别 
和 语音 合成 的 基本 方法 、 原 理 和 技术 。 
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~ 一 和 
。 一 27.1 语音 识别 


语音 识别 是 指 机 器 收 到 语音 信号 后 ， 如 何 模仿 人 的 听觉 器 官 辨别 所 听 到 的 语音 内 容 或 讲 
话 人 的 特征 ， 进 而 模仿 人 脑 理解 出 该 语音 的 含义 或 判别 出 讲话 人 的 过 程 。 语 音 识别 是 数字 语 
音 应 用 的 一 个 重要 方面 ， 语 音 识别 系统 按 其 构成 与 规模 有 多 种 不 同 的 分 类 标准 。 
































。 按 讲话 者 分 类 
语音 识别 系统 如 果 按 讲话 者 作为 分 类 标准 ， 可 分 为 特定 人 语音 识别 系统 和 非特 定 人 语音 
识别 系统 。 


1) 特定 人 语音 识别 系统 
特定 人 语音 识别 系统 的 特点 是 依赖 于 讲话 者 ， 只 有 在 用 特定 单词 组 形成 的 词汇 表 系统 训 
练 后 ， 它 才能 识别 。 为 了 训练 系统 识别 单词 ， A 3 





次 一 个 。 把 单词 输入 系统 的 过 程 重复 几 次 ， 这 样 会 在 计算 机 中 生 单词 的 参考 模板 。 系 统 必 

须 在 将 来 使 用 的 环境 中 训练 ， 以 便 考虑 周围 环境 的 影响 。 例 如 ,、 如 果 系 统 要 在 工厂 中 使 用 ， 

就 必须 在 工厂 中 训练 它 ， 以 把 背景 噪声 也 考虑 在 内 。 We 枯燥 的 ， 但 为 使 识别 器 能 高 效 

也 工作 ， 彻 底 训练 是 很 重要 的 。 AR 境 中 使 用 识别 器 ， 它 也 许 不 能 很 好 
AN 






























































也 工作 。 ,KX 

和 定 人 清关 识 人 的 人 有 光一 可 以 训练 它 来 识别 新 词 。 通 
常 ， 这 种 类 型 的 系统 用 于 词汇 量 少 于 :000 词 9 小 词汇 表情 况 。 这 种 小 词汇 表 的 典型 应 用 是 
于 定制 应 用 软件 需要 的 用 户 命令 和 NA 














(界面 。 虽 然 可 以 训练 特定 人 的 系统 来 识别 更 大 的 词 
汇 表 ， 但 还 存在 一 些 要 权衡 考虑 的 方面 : 第 一 ， 这 人 
需要 重复 进行 很 多 次 ， 第 二 , "为 识别 大 词汇 表 中 的 
进行 的 搜索 需要 更 长 的 时 间 ;- 这 影响 了 系统 的 融 体 性 
特定 人 的 系统 的 三 点 是 由 一 个 用 户 训练 的 系统 不 能 被 另 一 用 户 使 用 。 如 果 训 练 系统 的 
户 得 了 常见 的 感冒 或 声 党 有 些 变 化 ， 系 统 就 会 识别 不 出 用 户 或 犯错 误 。 在 支持 大 量 用 户 的 系 
统 中 ， 存 储 要 求 姿 很 高 ， 因 为 必须 为 每 个 用 户 存储 语音 识别 数据 。 目 前 ， 市 面 上 常见 的 汉字 
语音 输入 系统 基本 都 是 基于 特定 人 语音 识别 。 
2) 非特 定 人 识别 系统 
此 类 系统 可 识别 任何 用 户 的 语音 。 它 不 需要 任何 来 自用 户 的 训练 ， 因 为 它 不 依赖 于 个 人 
的 语音 签名 。 无 论 是 男声 还 是 女声 ， 用 户 是 否 得 了 感冒 ， 环 境 是 否 改变 或 噪声 如 何 ， 或 者 用 
户 讲 方言 并 带 有 口音 ， 都 没有 关系 。 为 生成 非特 定 人 识别 系统 ， 需 大 量 的 用 户 训练 一 个 大 词 
汇 表 的 识别 器 。 在 训练 系统 时 ， 男 声 和 女声 ， 不 同 的 口音 和 方言 ， 以 及 带 有 背景 噪声 的 环境 
都 计 入 了 考虑 范围 之 内 以 生成 参考 模板 。 系 统 并 不 是 为 每 种 情况 下 的 每 个 用 户 建立 模板 ， 而 
是 为 每 种 声音 生成 了 一 批 模式 ， 并 在 此 基础 上 建立 词汇 表 。 
2. 按 识别 词 的 性 质 分 类 
如 果 按 识别 词 的 性 质 来 分 ， 语 音 识别 系统 又 可 分 成 3 类 : 孤立 词语 音 识别 、 连 接 词语 音 
识别 和 连续 语音 识别 。 
这 3 种 系统 具有 不 同 的 作用 和 要 求 。 它 们 使 用 不 同 的 机 理 来 完成 语音 识别 任务 。 
1) 孤立 词 (语音 ) 识 别 系统 
孤立 词 (语音 ) 识 别 系统 如 图 2.14 所 示 ， 一 次 只 提供 一 个 单一 词 的 识别 。 用 户 必须 把 输入 


be 














要 大 量 的 存储 ， 第 三 ， 为 识别 词 而 





oe ee es 
词 需 






































































































































音频 信号 处 理 技术 | 。 

的 每 个 词 用 暂停 分 开 ， 和 暂停 像 一 个 标志 ， 它 标志 一 个 词 的 结束 和 下 一 词 的 开始 。 识 别 器 的 第 
一 个 任务 是 进行 幅度 和 噪声 归 一 化 ， 以 使 由 于 周围 的 噪声 、 讲 话 者 的 声音 、 讲 话 者 与 麦克 风 
的 相对 距离 和 位 置 ， 以 及 由 讲话 者 的 呼吸 噪声 而 引起 的 语音 变化 最 小 化 。 下 一 步 是 参数 分 析 ， 
这 是 一 个 抽取 语音 参数 的 时 间 相 关 变 化 序列 ， 如 共振 峰 、 辅 音 、 线 性 可 预测 编码 系数 等 的 巴 
处 理 阶段 。 这 一 阶段 的 作用 有 两 个 ; 第 一 ， 它 抽取 了 与 下 一 阶段 相关 的 时 间 变化 语音 参数 ; 
第 二 ， 它 通过 抽取 相关 语音 参数 而 减少 了 数据 量 。 如 果 识 别 器 在 训练 方式 中 ， 就 会 把 新 的 帧 
加 在 参考 表 上 。 如 果 它 是 在 识别 方式 中 ， 就 会 把 动态 时 间 变 形 用 于 未 知 的 模式 上 以 计划 音素 
持续 的 平均 值 。 然 后 ， 未 知 模式 与 参考 模式 相 比较 ， 从 表 中 选 出 最 大 相似 度 参考 模式 。 




































































X: 
输 ilIV5 本 的 参考 模式 






Xk 3 
。 一 图 2.14 焉 立 词 哺 音 ) 识 别 系统 

可 以 通过 把 对 记 宇 -个 词 的 大 量 样本 于 入 为 单一 群 来 获得 非特 定 人 孤立 单词 语音 识别 

各 .例如 ,可 号 N90 人 用 广博 有 不 同 的 和 方 的 人间 词 25 的 必 收入， 

这 样 每 个 词 就 有 /2 500 个 样本 。 把 这 2 500 个 样本 中 声学 上 相似 的 样本 聚集 在 一 起 就 形成 了 对 

应 于 单词 的 单一 群 ， 群 就 成 为 了 这 个 词 的 参考 。 


随 着 词汇 表 尺寸 的 增加 ， 参 考 模式 需要 更 多 的 存储 空间 ， 计 算 和 搜索 就 需要 更 多 的 计算 
时 间 ， 如 果 计 算 时 间 和 搜索 时 间 变 长 ， 反 应 时 间 就 会 变 长 ， 同 时 随 着 处 理 信息 的 增加 ， 错 误 
率 也 会 增加 。 


前 面 已 经 讨论 了 特定 人 和 非特 定 人 语音 识别 系统 间 区 别 的 关键 。 而 孤立 单词 语音 识别 器 
和 连接 词语 音 识别 器 之 间 的 主要 区 别 是 正确 地 把 两 个 词 之 间 的 沉默 与 所 讲 词 的 音节 之 间 的 沉 
默 分 离开 来 的 这 种 能 力 。 有 效 地 使 用 单词 识别 的 音素 分 析 会 有 助 于 识别 音节 之 间 的 间断 。 
2) 连接 词语 音 识 别 
连接 词语 音 与 连续 语音 的 区 别 是 什么 ? 连接 词 的 语音 由 所 说 的 短语 组 成 ， 而 短语 又 是 
词 序列 组 成 ， 如 “ 王 主任 ”和 “我 们 的 领导 是 王 主任 ”。 相 比较 而 言 ， 连 续 语 音 由 在 听写 中 形 
成 段落 的 完整 句子 组 成 ， 同 时 它 需 要 更 大 的 词汇 表 比 较 。 
那么 ,为 什么 要 把 连接 词 识别 单独 分 出 来 ? 孤立 单词 语音 识别 (也 称 命令 识别 ) 使 用 暂停 作 
为 词 的 结束 和 开端 标志 。 讲 出 的 连接 词 的 序列 ， 如 在 短语 中 那样 ， 也 许 在 单词 之 间 没 有 足够 
长 的 暂停 来 清楚 地 确定 一 个 词 的 结束 和 下 一 个 词 的 开始 。 识 别 连接 词 短语 中 单词 的 一 种 方法 
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忆 胀 本 可 团 当 


下 多 媒体 找 坟 及 黄 应 用 (第 之 服 ) 

词 定位 技术 。 在 这 一 技术 中 ， 通 过 补偿 语音 速率 变化 来 完成 识别 ， 而 补偿 语音 速率 变 
是 通过 前 面 所 述 的 称 为 动态 时 间 变 形 的 过 程 ， 以 及 把 调整 了 的 连接 词 短语 表示 成 沿 时 间 
过 所 存储 的 单词 模板 以 找到 可 能 的 匹配 这 样 一 个 过 程 来 实现 的 。 如 果 在 给 定时 间 内 ， 任 
似 性 显示 出 已 经 在 说 出 的 短语 和 模板 中 找到 了 相同 的 词 ， 识 别 器 就 定位 出 模板 中 的 关键 
将 动态 时 间 变 形 技 术 用 于 连接 词 短 语 上 来 消除 或 减少 由 于 讲话 者 个 人 或 其 他 影响 语音 的 
， 如 因 兴 奋 而 造成 的 讲 出 单词 速率 的 变化 。 不 同情 况 下 ， 可 以 用 不 同 的 重音 和 速度 说 出 
短语 。 如 果 我 们 在 每 次 用 不 同 的 重音 说 出 短语 时 ， 都 抽取 所 说 短语 的 瞬时 写照 ， 并 在 时 
中 生成 帧 ， 我 们 会 很 快 发 现 每 一 获取 帧 是 如 何 相 对 其 他 帧 而 变化 的 。 这 就 提供 了 表示 所 
语 中 可 能 变化 的 时 间 变 化 参数 范围 。 当 把 动态 时 间 变 形 技术 用 于 连接 词语 音 识 别 时 ， 就 
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数学 上 的 压缩 或 扩展 帧 去 除 可 能 的 时 间 变化 , 然后 把 帧 与 存储 模板 相 比较 来 进行 识别 。 
为 什么 连接 词语 音 识别 是 有 用 的 ? 这 是 一 种 命令 识别 的 高 级 形式 ， 其 中 命令 是 短语 而 不 
a oh he ee es yl 
电 查 询 总 部 电话 并 所 号 。 类 似 于 孤立 词语 音 识 别 ， 连 接 词语 识别 可 用 于 命令 和 控制 应 









































中 。 

3) 连续 语音 识别 站 
这 种 方法 比 了 立 单词 或 连接 词语 音 识别 孝 复杂 许多 。 它 提出 了 两 个 主要 问题 ， 分 铀 和 标 
程 ， 在 此 过 程 中 把 语音 段 标记 成 代表 音素 :浊音 节 、 音 节 和 单词 等 更 小 的 单元 ， 以 及 为 
给 入 语音 并 实时 地 识别 词 序列 所 需要 的 计算 能 力 。 用 现行 的 数字 信号 处 理 器 ， 可 以 通过 
正确 的 CPU 体系 结构 来 获得 实时 连续 语音 识别 需要 的 计算 能 力 。 连续 语音 识别 系统 可 以 
下 3 部 分 。 AN XX 

(1) 数字 化 、 幅 度 归 一 化 时间 六 一 化 和 参数 表示 六 

C) 分 割 并 把 语音 段 标记 成 在 基于 知识 或 基于 规则 系统 上 的 符号 串 。 用 于 表征 语言 段 特 
知识 类 型 是 ， 语 普 学 ， 它 描述 了 语音 声音 (英语 中 只 有 41 个 音素 )， 词汇 学 ， 它 描述 了 声音 























语法 ， 它 描述 了 语言 的 语法 结构 ， 语 义学 ， 它 描述 了 词 和 句子 语义 ， 语 用 学 ， 它 描述 了 
的 上 下 文 : 客 数 连续 语音 识别 系统 是 使 用 基于 语音 学 的 、 词 汇 学 的 、 语 法 的 知识 系统 。 


(3) 识别 词 序列 并 进行 语音 段 匹 配 。 在 连续 语音 识别 系统 中 , 语音 信号 的 前 端 处 理 与 孤立 
语音 识别 系统 中 的 一 样 。 它 把 模拟 信号 转换 成 数字 信和 号， 进行 幅度 和 噪声 归 一 化 以 使 
围 噪声 、 讲 话 者 的 声音 、 讲 话 者 相对 于 麦克 风 的 距离 和 位 置 、 讲 话 者 的 呼吸 噪声 等 引起 
音 变化 最 小 化 。 下 一 步 由 参数 分 析 组 成 ， 它 是 一 个 抽取 时 间 变 化 的 语音 参数 ， 如 共振 峰 、 
、 线 性 可 预测 编码 系数 等 的 预 处 理 阶段 。 这 一 步骤 有 两 个 目的 ; 首先 ， 它 抽取 了 与 下 一 
关 的 时 间 变 化 语音 参数 ， 其 次 ， 它 通过 抽取 相关 语音 参数 而 减少 了 数据 量 。 

下 一 步 完 成 把 语音 分 割 为 10ms 的 段 并 标记 这 些 段 .如 何 标记 语音 段 ? 孤立 词语 音 识 别 器 
了 把 未 知 发 音 与 已 知 的 参考 模式 相 比较 的 技术 。 如 果 未 知 发 音 与 已 知 参考 模式 之 一 相 类 
那么 就 找到 了 一 个 匹配 并 识别 出 了 发 音 。 对 于 连续 语音 识别 ， 例 如 ，100 个 词 的 词汇 表 
要 超过 1 000 个 参考 模式 。 这 就 要 求 更 大 的 存储 和 更 快 的 计算 引擎 在 模式 中 搜索 并 完成 
式 输入 到 系统 中 的 处 理 。 如 果实 时 地 完成 上 述 处理 ， 这 将 会 是 一 个 很 高 的 要 求 。 为 解决 
问题 ， 要 把 语音 分 割 成 更 小 的 符号 单元 段 ， 它 们 表示 语音 、 音 素 、 半 音节 、 音 节 和 单词 。 
过 程 生成 了 10ms 的 “快照 >， 并 把 语音 的 时 间 变 化 表示 转换 成 符号 表示 。 

再 下 一 步 是 对 语音 段 作 标记 ， 其 中 使 用 了 由 语音 、 词 汇 语法 和 语义 知识 组 成 的 知识 系统 。 

















[= 






























































ke 


过 程 应 用 了 一 种 基于 知识 系统 来 标记 语音 段 的 启发 式 方法 。 把 语音 段 结合 起 来 以 形成 音 














素 ， 把 音素 结合 起 来 以 形成 单词 。 单 词 经 过 一 种 确认 过 程 ， 并 使 用 语法 和 语义 知识 来 形成 句 
子 。 这 一 过 程 是 极为 数学 化 ， 十 分 复杂 ， 在 此 不 再 獒 述 。 


2.7.2 ”语音 合 

















语音 合成 是 人 工 产生 语音 的 过 程 ， 根 据 语音 生成 原理 ， 现 在 的 语音 合成 方法 大 致 可 分 为 
3 种 类 型 : 基于 波形 编码 的 合成 ， 基于 分 析 - 合 成 法 的 合成 ; 按 规则 合成 。 上 述 3 种 方法 的 基 
本 原理 ， 如 图 2.15 所 示 。 


[aaams ] ( 分 析 合 成 ] ( tems ] 





输入 数据 








语音 ~ 好， 语音 语音 


X 诊 。 3 种 语音 合 cn 
基于 波形 编 ; 码 合成 方法 的 合 ?成 系统 ， 它 的 简单 ， 并 能 产生 高 质量 的 语音 ， 但 不 够 
灵活 ; 4 规则 全 方法 村 的 系统 是 - 神 极 端 ， 它 具 有 非常 大 的 灵活 性 ， 但 相当 复杂 ， 它 
产生 的 语音 质量 与 炎 产 生 的 语音 质量 相 比 ， 仍 然 相差 其 远 。 实 际 应 用 中 ， 到 底 采用 什么 方法 
应 按 使 用 环境 和 目的 加 以 选用 。 
， 波 形 编码 合成 法 
en 若 有 一 个 句子 要 让 
机 器 读 出 来 ， 则 选择 适当 的 词 和 短语 单元 ， 然 后 把 它们 连接 起 来 产生 语音 输出 。 用 这 种 方法 
wo 连接 处 的 声学 特性 包括 谱 包 络 、 
幅度 、 基 频 及 速率 。 若 存储 和 使 用 较 大 的 语音 单元 ， 如 短 词 和 句子 ， 则 合成 产生 的 词 和 句子 
的 种 类 和 数量 均 受到 限制 ， 但 合成 语音 的 可 懂 度 和 自然 度 都 比较 好 。 相 反 ， 如 果 存储 和 使 
的 语音 单元 较 小 ， 如 音节 和 音素 ， 那 么 合成 语音 的 质量 将 大 大 降低 ， 但 合成 产生 的 词 和 句子 
的 范围 较 广 。 在 这 种 合成 法 中 ， 由 于 词 或 短语 在 不 同 句子 中 的 音调 不 同 ， 如 疑问 句 、 陈 述 句 
或 感叹 句 ， 因 此 一 个 相同 的 词 或 短语 往往 要 以 几 种 不 同音 调 的 形式 存储 。 
这 种 方法 产生 的 语音 存在 两 个 不 足 ， 一 是 用 孤立 词 或 短语 连接 的 句子 ， 产 生 的 声音 听 
起 来 觉得 慢 ; 另 一 个 是 句子 的 重音 、 节 奏 、 语 调 听 起 来 不 太 自然 。 
分 析 一 合成 法 

分 析 一 合成 法 是 根据 语音 生成 模型 ， 把 人 说 的 词 或 短语 进行 分 析 ， 抽 取 它 们 的 特性 参数 ， 
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一 多 若 你 乒 林 及 站 应 用 (第 二 服 ) 


一 并 按 特性 参数 的 时 间 顺序 把 参数 存储 起 来 。 合 成 语音 时 ， 把 恰当 单元 的 参数 序列 连接 起 


来 ， 





然后 送 到 语音 合成 器 产生 语音 输出 。 用 这 种 方法 产生 的 语音 ， 虽 然 它 的 自然 度 稍 差 ， 但 





1 于 








存储 的 是 词 或 短语 的 特性 参数 ， 所 以 可 以 大 大 降低 存储 容量 的 要 求 。 此 外 ， 单 元 连接 处 
音 特性 可 以 通过 控制 特性 参数 来 改善 。 这 种 方法 存储 的 语音 单元 不 是 简单 的 原始 语音 ， 
对 词 或 短 词 进行 压缩 ， 存 储 的 是 特性 参数 。 因 此 ， 从 这 个 观点 来 看 ， 分 析 一 合成 法 可 以 
是 波形 编码 方法 的 一 种 高 级 形式 。 

3， 基 于 语音 生成 机 理 的 合成 法 

用 电路 模拟 语音 生成 机 理 以 产生 合成 语音 ， 文 献上 介绍 较 多 的 有 两 种 方法 ， 一 种 称 
道 模拟 法 (Vocal Track Analog)， 另 一 种 称 为 终端 模拟 法 (Terminal Analog)。 前 者 是 模拟 声 
声 道上 传播 ， 把 声 道 看 成 由 许多 管子 串联 的 系统 ， 后 者 是 模拟 声 道 的 频谱 结构 ， 也 就 是 
和 反 谐 振 特性 ， 把 声 道 看 成 是 谐振 腔 。 - 

文 一 语 转换 (Text to Speech) 是 文字 转换 成 语音 的 简称 。 文 字 是 数字 或 代码 形式 表示 的 
信息 ， 而 这 里 指 的 语音 不 是 通过 人 的 嘴巴 说 出 的 语音 ， 而 是 合成 后 发 出 的 语音 。 
技术 曾 广泛 用 于 为 盲人 设计 的 语音 阅读 设备 ， 但 在 过 去 的 几 年 时， 这 项 技术 的 迅速 发 展 已 远 
出 了 盲人 的 使 用 范围 。 例 如 ， 文 一 语 转换 技术 能 够 把 电 (Electronic Mail) 转 换 成 语音 
(Voice Mail)， 再 通过 电话 来 阅读 ， 通过 电话 来 阅读 夫 型 文本 数据 库 是 文 一 语 转换 的 另 一 个 应 
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Nt ee 19、 音素 连接 成 适 
这 个 语音 不 是 真正 的 合成 语音 ， 而 :现存 音 的 重新 安排 。 在 要 求 


子 。 目前， 在 多 媒体 PC 中 ， 0 配 有 语音 卡 的 PC 都 可 以 具有 这 种 功能 。 






的 顺序 后 再 发 出 语 














的 语 
而 是 
认为 


为 声 
波 在 
谐振 





语言 
这 项 
远 超 
8 件 
例 























wr. 
百 。 


汇 量 少 的 情况 下 ， 这 种 


文 一 语 转换 是 很 有 用 的 ， 如 电话 和 的 辅助 系统 中 仅 需 有 限 的 短语 和 电话 号 码 。 但 即使 在 这 类 
应 用 系统 中 也 有 一 个 音调 问题 窒 业 话 不 得 不 用 不 同 搬家 好 几 壳 ， 而 应 用 系统 志 不 得 丰 


根据 内 容 选择 音调 合适 的 话 。“” Nw 
宝生 和 的 世人 革 下 辣 让 生计 站 过 和 人 大 放电 省 
人 读书 面 文章 的 过 程 这 个 过 程 既 包 含有 很 高 级 的 





























处 理 ， 又 包含 发 音 器 官 复杂 的 生理 控 


制 。 因 此 ， 要 实现 这 种 文 一 语 转换 需要 广博 的 知识 和 高 深 技术 。 典 型 的 文 一 语 转换 系统 结构 





如 图 2.16 所 示 。7 





图 2.16 文 一 语 转 化 系统 结构 
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图 2.16 可 以 看 出 ， 文 一 语 转换 系统 由 两 个 部 分 组 成 ， 一 部 分 是 发 音 器 ， 这 里 主要 是 指 
语音 合成 器 ， 它 相当 人 的 发 音 系统 。 另 一 部 分 是 发 声 的 驱动 器 ， 它 的 输入 是 要 发 声 的 文本 串 





| 全 过 








或 其 他 语言 信息 ， 而 它 的 输出 用 来 驱动 发 声 器 发 声 。 这 两 个 部 件 都 可 用 软件 实现 。 国 内 一 些 
大 学 、 研 究 所 已 完成 了 文 一 语 转换 的 实验 性 系统 ， 随 着 功能 的 不 断 完善 ， 实 用 化 可 望 早日 从 
现 。 总 的 来 说 ， 文 一 语 转换 是 一 个 多 学 科 的 研究 领域 ， 它 需要 多 方面 的 科学 工作 者 ， 如 语言 
学 家 、 语 音 学 家 、 通 信 科 学 家 、 生 理学 家 、 心 理学 家 及 电子 工程 技术 人 员 的 共同 努力 。 


2.8 声音 媒体 编辑 软件 的 应 用 










































































为 了 能 对 数字 声音 进行 录制 与 编辑 ， 涌 现 出 了 许多 声音 编辑 软件 。 本 节 介绍 两 种 常用 的 
声音 编辑 软件 。 


2.8.1 ”Windows 的 录音 机 软件 


各 果 在 计算 机 上 安 半 了 声卡 和 录音 话 和 (天 克 风 )， 使 用 便捷 多 .Windows 录音机 软件 便 可 
直接 进行 声音 的 录制 、 编 辑 或 播放 。 AAA 

Windows 录音 机 的 主要 功能 涉及 声音 的 录制 、 播 放 w 编辑 效果 处 理 和 文件 的 管理 。 在 
Windows 中 选择 “开始 ”一 “所 有 程序 ”一 “附件 ”一 “如 条 ”一目 pa 
“录音 机 ”选项 ， 打 开 声 音 控制 面板 ， 如 图 2.17 所 未 :j} Windows hp ma wp Wi 
附件 中 的 录音 机 界面 上 除了 菜单 和 常规 录音 机 的 录放 控制 按钮 “| ER 


外 ， 还 提供 了 录音 或 播放 过 程 中 的 有 关 储 息 。 当 前 声音 所 处 的 “一 
位 置 和 总 长 度 是 以 时 间 为 参照 单位 显示 的 》 可 移动 的 滑 块 位 置 、 21> | |= | e | 
与 播放 声音 所 处 的 位 置 相对 应 * 同时 太 用 动态 方式 来 显示 即时 

声波 的 波形 。“ 录 音 机 ”中 编辑 的 声音 文件 必须 是 未 压缩 的 站 录 。 图 217， 录音 机 程序 界面 
下 的 声音 被 保存 为 波形 (av) 文件 。 NA 

1 声音 的 录制 和 播放 Ed 

(D 录制 声 济 : 立 击 程序 界面 上 的 红色 “录音” 按钮， 程序 开始 接收 传 入 的 声音 。 

默认 录音 “发 度 ” 值 为 60s， 当 录音 进行 到 60s 时 将 自动 停止 。 如果 再 次 按 下 “录音 ” 按 
钮 ,“ 长 度 ” 值 将 会 增加 60s。 

录音 之 后 ， 选 择 “ 文 件 ” 一 “保存 ” 选项， 打开“ 另存 为 ”对 话 框 ， 在 “文件 名 ”文本 
框 中 输入 文件 名 ， 单 击 “ 保 存 ”按钮 ， 便 将 刚 录入 的 数字 声音 存盘 。 

(2) 播放 声音 :可 针对 刚 录制 的 声音 ， 或 者 选择 “文件 ”一 “打开 ”选项 ， 打 开 已 存在 的 

首 文件 。 单 击 软件 面板 上 的 “ 放 首 ”按钮 ， 可 使 声音 文件 从 头 播放 ， 而 移动 滑 块 可 随意 改 
变 播放 位 置 。 

2. 声音 的 编辑 

(1) 裁 前 首 、 尾 声音 片段 拖 自 滑 块 到 要 分 隔 声 音 的 位 置 ， 选 择 “编辑” 一 “删除 当前 位 
置 以 前 的 内 容 ”或 “删除 当前 位 置 以 后 的 内 容 ” 选 项 ， 在 打开 的 提示 对 话 框 中 单 击 “ 确 定 ” 
按钮 ， 完 成 首部 或 尾部 声音 的 裁剪 。 

(2) 裁剪 中 间 声 音 片段 : 拖 点 滑 块 到 第 一 部 分 要 保留 的 声 首 结束 位 置 , 选择 “编辑 ”一 “ 复 
制 ” 选 项 。 拖 点 滑 抉 到 要 删除 部 分 的 结束 位 置 ， 选 择 “ 编 辑 ” 一 “粘贴 插入 ”选项 。 然 后 先 
择 “编辑” 一 “删除 当前 位 置 以 前 的 内 容 ” 选 项 ， 在 打开 的 提示 对 话 框 中 单 击 “ 确 定 ” 按 铅 ， 
可 完成 中 间 片 段 的 裁剪 。 
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全 技 术 肥 其 应 用 (第 厂 ) 
(3) 插入 声音 片段 : 先 打开 声音 文件 ， 如 “wl.wav”， 将 滑 块 移动 到 需要 插入 其 他 声音 
”人 件 的 位 置 。 选 择 “ 编 辑 ” 一 “插入 文件 ”选项 ， 可 将 其 他 声音 文件 ， 如 “w2.wav”， 从 滑 块 位 
置 插入 “wl.wav”。 

(4) 合并 声音 片段 ， 先 打开 声音 文件 ， 如 “wl.wav”， 将 滑 块 移动 到 需要 与 其 他 声音 文件 
合并 的 位 置 。 选 择 “ 编 辑 ” 一 “与 文件 混 音 ”选项 ， 可 将 其 他 声音 文件 与 当前 文件 声音 效果 
相 混 合 。 

3 编辑 声音 使 形成 特殊 效果 

在 “效果 ”菜单 中 , 选择 相应 的 选项 可 以 使 录制 的 声音 变调 而 产生 特殊 的 效果 , 如 图 2.18 
所 示 。 




















EPE el Ed] 对 声音 效果 每 选择 一 次 “加 大 音量 ” 选项 ， 将 提高 原来 音 

人 ES 量 的 25%， 声 音 将 变 得 高 而 润 ， 每 选择 一 次 “减速 ”选项 ， 声 

EGG | | 音 的 时 间 将 比 原来 延长 一 倍 ， 原 来 的 声音 将 变 慢 ;选择 “添加 

[SR | 回音 ”选项 便 可 产生 回荡 效果 人 选择 “ 反 转 ”选项 ， 可 反 向 
BD 播放 声音 文件 。 \ 






事实 上 ，WindoWs\“ 麻 音 机 ”编辑 波形 文件 的 功能 较 弱 ， 
图 2.18 录音 机 “效果 ” 菜单。 有 些 软件 如 CooLEdit 提供 了 很 强 的 编辑 功能 。 
2.8.2 ”声音 编辑 软件 Cool Edit A 

Cool Edit 是 - -个 功能 强大 的 多 音 轨 音频 混合 编辑 软件 汇集 录音 、 混 音 、 编 辑 于 一 体 。 使 
用 简捷 、 方 便 ， 很 受用 户 的 欢迎 ? 它 包含 高 品质 的 数字 效果 组 件 ， 可 在 任何 声卡 上 进行 64 轨 
混 音 ， 只 要 存储 空间 允许 也 可 以 任意 时 间 长 度 地 录音 5 在 互联 网 上 ， 可 以 下 载 到 它 的 免费 试 
用 版 。 | SS 

1， 启 动 运行 ,Cool Edit 

首先 安装 CiorEdit， 然 后 启动 它 ， 运 行 后 的 界面 如 图 2.19 所 示 。 打 开 一 个 声音 文件 ， 可 
以 看 到 图 中 显示 了 该 声音 的 左右 声 道 的 波形 (上 为 L， 下 为 R)， 默 认 情 况 下 ， 可 以 对 两 个 声 道 
同时 操作 ， 也 可 以 单独 对 其 中 的 一 个 声 道 操作 。 






图 2.19 ”Cool Edit 的 运行 界面 
用 鼠标 选择 波形 的 一 部 分 ， 被 选中 的 部 分 将 会 反 色 显示 ， 可 以 像 操作 文件 一 样 地 进行 简 
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| 





单 的 声音 编辑 (如 复制 、 插 入 、 删 除 等 )， 如 图 2.20 所 示 。 


a TS 


EN 


I pe 革 协 人才 外 一 


| = 有 | 
mn 加 本 查 月 





图 2.20 音频 的 简单 编辑 YA 
r Is 
2. 数字 音频 的 简单 编辑 CK 本 


Cool Edit 对 声音 的 编辑 非常 简单 ， 如 同 Word 对 又 文字 的 六 加- - 样 ， 首 先 选中 要 编辑 的 部 
分 ， 然 后 进行 编辑 操作 (如 复制 、 插 入 、 删 除 等 )， RE Cool Edit 的 运行 界面 区 便 可 看 到 
编辑 效果 。 

例如 ， 将 声音 文件 的 某 - -和 移动 到 另外 lh, 操作 步骤 如 下 。 

(1) 用 鼠标 选择 要 移动 波形 的 部 分 被 选中 的 部 4 分 将 会 反 色 显示 (如 图 2.20 所 示 )。 

(2) 选择 “Edit” 一 “Cut” 选项 (或 按 Ctrl 十 X 组 合 键 )1 

G3) 将 光标 移 到 另外 一 个 所 要 的 位 置 ， 选择 “Edit" 一 “Pasie” 选项 (或 按 Ctrl 十 V 组 合 键 )。 
即 可 完成 将 一 段 声音 从 - 个 位 置 移动 到 另 - -个 位 置 ~ 

3 放大、 衰减 丢 品 | A 

1 声 首 的 放大 或 共渡 

在 菜单 栏 选择 “Effects” 一 A 一 “Amplify” 选 项 ， 选 择 放 大 或 衰减 的 系数 ， 
或 者 从 右上 角 的 Presets 预 设 中 选取 原来 已 经 设置 好 的 参数 。 单 击 “OK” 按 钮 开始 泻 染 ， 可 
以 看 到 波形 已 经 发 生 了 变化 。 

2) 去 噪 

从 旧 磁 带 中 翻录 或 者 从 现场 采集 声音 ， 难 免 会 有 些 杂 音 ， 即 使 是 轿 新 的 录音 带 ， 在 转录 
的 过 程 中 也 会 混入 一 些 系统 噪声 和 环境 噪声 。Cool Edit 提供 了 强大 的 去 噪 功能 。 它 对 降低 噪 
声 的 基本 思路 是 ， 先 设法 分 析出 噪声 源 的 频谱 特性 ， 然 后 削弱 整个 声音 文件 中 符合 该 特征 的 
成 分 。 

操作 步骤 是 ， 在 菜单 栏 中 选择 “Effects” 一 “Noise Reduction” 一 “Noise Reduction” 选 
项 ， 打 开 “Noise Reduction” 对 话 框 ， 调 整 相 应 的 参数 设置 ， 就 可 以 对 原始 声音 素材 进行 降 噪 
处 理 了 。 

4. 淡 入 淡出 处 理 

在 声音 处 理 中 ， 经 常用 到 的 一 个 效果 是 淡 入 淡出 ， 如 一 个 声音 开始 的 时 候 ， 音 量 从 小 到 
大 渐变 ， 或 者 一 首 歌 到 了 末尾 结束 的 时 候 声音 渐渐 变 小 ， 给 人 以 远 去 的 感觉 。 淡 入 淡出 是 影 
视 作品 中 很 常用 的 一 种 处 理 手 段 ， 它 能 使 不 同 场景 之 间 的 音乐 或 背景 音效 过 渡 更 为 自然 。 
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OO 全 多 天 你 撤 术 及 站 应 用 (第 2 版 ) 

一 ”在 Cool Edit 中 实现 这 些 效果 非常 容易 ， 选 择 “Effects” 一 “Amplitude” 一 “Amplify” 
选项 ， 打 开 “Amplify” 对 话 框 ， 选 择 Fade 选项 卡 ， 如 图 2.21 所 示 ， 就 可 以 对 声音 进行 淡 入 
淡出 的 处 理 了 。 














5， 增加 特殊 效果 


Cool Edit 可 为 编辑 的 声音 rae 5 等 特殊 效果 。 
1) 声音 的 变调 处 理 XXX 、 
咎 动 Cool Edit， 载 入 需 要 处 理 的 音 文 件 。 选择 Bf 一 “Time/Pitch” 一 “Stretch” 
选项 ， 打 开 “Stretch” 对 话 框 ,点 选 “Pitch Shift” 按钮 ， 固 定 音 频 的 节拍 。 然 后 ， 通 过 
Transpose 下 拉 列 表 框 进行 调整 ， 人 音 RE 好 变调 幅度 ， 可 以 半 度 半 度 地 和 调 或 


降 调 ， 如 图 2.22 所 示人 一 KR 























图 2.22 ”变调 的 参数 设置 


单 击 “OK” 按 钮 ， 开 始 泻 染 。 完 成 后 ， 即 可 按 播放 键 试听 变调 后 的 效果 。 


2) 加 入 回音 效果 
选择 “Effects” 一 “Delay Effects” 一 “Echo” 选 项 ， 打 开 “Echo” 对 话 框 ， 即 可 对 声音 
进行 回音 处 理 。 回 音 的 选项 很 多 ， 一 般 可 以 使 用 已 经 存在 的 预 设 值 。 通 过 改变 这 些 值 ， 可 以 


得 到 不 同 的 回音 效果 。 


区 
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6. 混 音 

若 要 将 两 个 声音 文件 受 加 在 一 起 ， 如 为 一 段 语 音 解说 配 上 背景 音乐 ， 的 
假设 有 两 个 波形 声音 文件 A.wav 和 B.wav， 想 混合 成 一 个 同时 输出 的 WAV 文件 , 打开 两 个 
音 文件 , 在 第 一 音 轨 上 (TRACKI) 右 击 , 在 弹出 的 快捷 菜单 中 选择 “Insert” 一 “Wave form ee 
选项 ,打开 “Open a Waveform ”对 话 框 ， 选 择 B.wav 文件 ， 单 击 “ 打 开 ” 按 钮 ， 即 插入 B.wav 
文件 ， 再 在 第 二 音 轨 上 用 同样 的 方法 将 A.wav 文件 插入 到 Cool Edit 中 ， 通 过 剪 切 、 删 除 ， 复 

制 等 操作 ， 将 两 部 分 声音 文件 的 长 度 修改 为 一 致 ， 使 两 个 声音 的 波形 基本 上 对 应 ， 按 Play 键 

试听 效果 ， 然 后 选择 “Edit” 一 “Mix Down to File” 一 “All Waves” 选 项 ， 把 这 两 个 声音 信 
号 混合 成 一 个 正常 的 双 声 道 WAV 文件 。 

Cool Edit 还 支持 多 种 声音 文件 格式 及 它们 之 间 的 转换 。 


29 小 结 “人 聆 
KK 


音 是 表达 信息 的 一 种 有 效 方式 。 让、 汪汪 用 请 
图 像 等 媒体 无 法 千代 的 效果 ， 使 得 多 媒体 应 用 更 加 生动 有 直 
本 章 首先 介绍 了 声音 的 基本 概念 ， 声 音 的 斋 、 类 型 ， 声卡 的 基本 知识 和 声卡 的 技术 将 
Ea 以 及 计算 机 如 何 处 理 声音 的 方法 。 。 塌 类 信息 角 9 数字 化 可 分 为 采样 、 量 化 和 编码 3 步 ， 语 
音 可 以 用 波形 文件 的 格式 存储 对 音乐 还 有 一 种 更 为 节省 存储 空间 的 方法 即 MIDI 文件 。 
音频 信息 数据 量 大 ， 因此 需要 纵 压缩 方法 可 分 为 光大 类 有 损 压缩 方法 和 无 损 压 缩 
方法 。 YK 
和 于 声音 是 人 类 交流 好 人 的 访 式 ， ie 学 者 以 人 的 语音 为 研究 对 象 ， 创 建 了 
新 的 研究 领域 : 语音 识别 和 语音 合成 。 语音 识 机 器 收 到 语音 信号 后 ， 如 何 模 仿 人 的 听 
re dh 进而 模仿 人 脑 理解 出 该 语音 的 含义 或 判别 出 









































讲话 人 的 过 程 合成 是 指 机 器 接 到 要 发 音 的 字符 串 后 ， 模 仿 人 脑 在 讲话 之 前 的 思维 过 程 
及 模仿 人 的 发 音 器 官 发 出 声音 的 过 程 。 本 章 中 概要 介绍 了 数字 语音 的 各 种 应 用 ， 以 增强 读者 
对 音频 处 理 技术 的 进一步 了 解 。 




















2.10 习 题 

1， 填 空 是 

(1) 人 类 能 够 接受 的 听觉 带宽 是 从 Hz 一 kHz。 

(2) 声音 数字 化 的 步骤 可 分 为 3 步 进行 ， 第 1 步 : 。 第 2 步 ; 。 第 3 
步 : 

(3) 重新 播放 数字 化 声音 ( 即 声 音 的 重 构 ) 步 又 : 解码 、 » 

(4) 目前 产生 MIDI 乐音 的 方法 很 多 , 现在 用 的 较 多 的 方法 有 两 种 : 一 补 是 FM (Frequency 
Modulation) 合 成 法 ， 另 一 种 是 合成 法 。 





(5) 采样 频率 为 22.05kHz、 量 化 精度 为 16 位 、 持 续 时 间 为 两 分 钟 的 双 声 道 声音 ， 未 压缩 
时 ， 数 据 量 是 MB。 





2 章 .有 


一 光 天 末 我 林 让 其 庙 用 (第 2 县 ) 








一 (6) 使 用 数字 波形 法 表示 声音 信息 时 ， 采 样 频率 越 高 ， 则 声音 质量 越 





2. 选择 题 
(1) 使 用 16 位 二 进 制 表示 声音 要 比 使 用 8 位 二 进 制 表示 声音 的 效果 
A. 噪声 小 ， 保 真 度 低 ， 音 质 差 B. 噪声 小 ， 保 真 度 高 ， 音 质 好 
C. 噪声 大 ， 保 真 度 高 ， 音 质 好 D. 噪声 大 ， 保 真 度 低 ， 音 质 差 
(2) 使 用 数字 波形 法 表示 声音 信息 时 ， 采 样 频率 越 高 ， 则 数据 量 
A. 越 小 B. 越 大 C. 恒定 D. 不 能 确定 
(3) 两 分 钟 双 声 道 ，16 位 采样 位 数 ，22.025kHz 采样 频率 声音 的 不 压缩 的 数据 量 是 _。 
A. 5.05MB B. 10.58MB C. 10.35MB D. 10.09MB 
(4) PC 中 有 一 种 类 型 为 MID 的 文件 , 下 面 关 于 此 类 文件 的 一 些 叙述 中 ,不 正确 的 是 __ 
A. 它 是 一 种 使 用 MIDI 规范 表示 的 音乐 ， 可 以 由 媒体 播放 器 之 类 的 软件 进行 播放 
B. 播放 MID 文件 时 ， 音 乐 是 由 PC 中 的 上 合成 来 
C. 同一 MID 文件 ， 使 用 不 同 的 PC 播放 时 ， 音 乐 的 质量 是 完全 一 样 的 
D. PC 中 的 音乐 除了 使 用 MID 文件 表示 之 外 地 可 以 使 用 WAV 文件 表示 
(5) MP3 文件 是 目前 较为 流行 的 音乐 i = 标准 对 WAVE 音频 文件 进 
行 压缩 而 成 的 。 wx 
A. MPEG-7 B. MPEG-4 - MPEG-2 D. MPEG-1 
(6) 在 下 列 有 关 声 卡 的 叙述 中 ， Ce 
a 阁 和 MIDI 声 间 9 输入 和 输出 
B ge 采样 频率 有 
C. 声卡 中 的 数 号 处理 器 在 完成 数字 声 从 解码 及 许多 编辑 操作 中 起 着 重 
要 的 作用 。 N99 
D. 因为 声卡 sie 以 用 ISA 总 线 进行 传输 已 足够 ， 因 此 , 目 


WN 是 ISA 接口 声卡 。 
wn PC 数字 声音 的 叙述 中 ， -ny 
， 语 音信 号 进行 数字 化 时 ， 每 秒 产生 的 数据 量 大 约 是 64KB 


dh 指 的 就 是 对 声音 的 波形 信号 数字 化 得 到 的 “波形 声音 ” 
C. 波形 声音 的 数据 量 较 大 ， 一 般 需 要 进行 压缩 编码 
D. MIDI 是 一 种 特殊 的 波形 声音 
(8) MP3 是 一 种 得 到 广泛 应 用 的 数字 声音 的 格式 ， 下 面 关于 MP3 的 叙述 中 ， 不 正确 的 

































































是 
. 与 MIDI 相 比 ， 表 达 同 一 首 乐曲 时 它 的 数据 量 比 MIDI 声音 要 少 得 多 
.MP3 声音 是 一 种 全 频带 声音 数字 化 之 后 经 过 压缩 编码 得 到 的 
.MP3 声音 的 码 率 小 ， 适 合 在 网 上 传输 

. MP3 声音 的 质量 几乎 与 CD 唱片 的 声音 质量 相当 
3， 判断 题 

(1) 声音 处 理 硬件 “声卡 ”就 是 一 块 插 在 计算 机 主板 上 的 1 
(2) 声卡 的 采样 率 与 量化 精度 都 是 影响 声音 数字 化 质量 的 重要 因素 。 人 未 
(3) MIDI 乐曲 可 合成 任何 声音 且 数 据 量 最 少 。 ( ) 
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是 Ir 
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(4) 声音 重 构 的 3 步骤 是 解码 、DA 转换 和 插值 。 ( ) 
(5) 在 声音 处 理 中 ， 经 常用 到 的 一 个 效果 是 淡 入 淡出 。 即 一 个 声音 开始 的 时 候 ， 音 量 从 小 
到 大 渐变 ， 或 者 一 首 歌 到 了 末尾 结束 的 时 候 声音 渐渐 变 小 ， 给 人 以 远 去 的 感觉 。 ¢€ 


4， 简 答题 

(D 声卡 的 主要 功能 有 哪些 ? 声卡 一 定 是 一 块 卡 吗 ? 

(2) 什么 是 MIDI 音乐? MIDI 音乐 如 何 产生 的 ? 有 什么 优 缺 点 ? 

(3) 要 使 声音 比较 真实 、 音 质 清晰 取决 于 声卡 的 什么 性 能 ? 

(4) 试 计算 以 44.1kHz 采样 ，16 位 量化 精度 为 多 少 。 双 声 道 录制 5min 的 波形 声音 ， 如 果 
未 加 压缩 ， 其 信息 量 为 多 少 ? 

(5) 什么 是 MP3? 其 压缩 标准 是 什么 ? 

(6) 什么 是 语音 合成 ? 

(7) 什么 是 语音 识别 ? /人 

(8) 声音 编辑 软件 Cool Edit 具有 哪些 主要 功能 ? ~\ 
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第 3 草 。 数字 图 像 与 视频 处 理 技术 


教学 提示 


Pe 

> 图 像 与 视频 是 两 种 常见 的 可 视 媒 体 。 图 像 、 视 频 的 获取 、 处 理 与 数 
字 化 技术 是 多 媒体 信息 处 理 的 重要 内 容 。 视频 是 指 内 容 随 时 间 变 化 
的 一 个 图 像 序列 世 称 活动 图 像 或 运动 图 像 。 数 字 图 像 与 视频 的 处 理 
技术 是 一 门 发 展 迅 速 、 应 用 广泛 的 学 科 分 支 ， 其 应 用 范围 涉及 人 类 
生活 的 各 站 方面 。 

教学 目标 

i 

> 一 本 章 主要 介绍 图 像 视 频 的 基础 知识 与 处 理 技术 ， 和 包括 图 像 、 视 频 
的 获取 、 表 示 、 处 理 与 应 用 等 ， 以 及 常用 图 像 、 视 频 处 理 软件 的 使 
用 。 通 过 本 章 的 学 习 ， 要 求 掌握 多 媒体 技术 中 有 关 图 像 、 视 频数 字 
化 的 基本 概念 、 方 法 、 技 术 与 应 用 等 知识 。 


六 | 





3.1 概 述 
信息 的 表示 形式 是 多 种 多 样 的 ， 有 文字 、 数 字 、 图 形 、 、 图 像 和 视频 等 ， 而 图 像 和 
视频 则 是 多 媒体 中 携带 信息 极其 重要 的 两 种 媒体 ， 入 们 获取 的 信息 的 70%% 来 自视 觉 觉 系统 ， 将 








这 些 信息 的 表现 形式 引入 计算 机 ， 便 给 传统 的 计算 机 赋予 了 新 的 含义 ， 也 对 计算 机 的 体系 结 
构 和 相关 的 处 理 技术 提出 了 新 的 要 求 。 

计算 机 中 的 数字 图 像 按 其 生成 方法 可 以 分 为 两 大 类 ， 一 类 是 从 现实 世界 中 通过 数字 化 设 
备 获 取 的 图 像 , 它们 称 为 取样 图 像 (Sampled Image)、 点 阵 图 像 (Dot Matrix Image)、 位 图 图 像 (Bit 
Map Image)， 以 下 简称 图 像 (mage); 另 一 类 是 计算 机 合成 的 图 像 ， 它 们 称 为 矢量 图 形 (Vector 
Graphics)， 或 简称 图 形 (Graphics)。 本 章 主 要 介绍 第 一 类 图 像 。 







































































从 现实 世界 中 获得 数字 图 Pe ee 的 设备 统称 为 图 像 
获取 设备 。 常 用 的 设备 有 图 像 扫描 仪 、 数 码 照相 机 等 。 Se 照片 或 
照相 底片 等 进行 扫描 输入 ， | ee 图 像 获 取 
的 过 程 








实质 上 是 模拟 信号 的 数字 化 过 程 。 A 
数字 图 像 最 基本 的 表示 单位 称 为 像素 (Pictur e Eleihent; pel)， 像 素 对 应 于 图 像 数 字 化 过 程 
中 的 一 个 取样 点 。 按 照 取样 点 表示 方式 的 不 同 了 人 可 作为 - 值 图 像 、 灰 度 图 像 和 彩 
色 图 像 。 将 一 幅 数 字 图 像 中 的 数据 按 一 定 方式 进行 组 织 称 为 图 像 的 编码 。 为 了 减少 数字 图 
像 的 存储 空间 往往 要 进行 压缩 编码 ， 支 图 像 压 缩编 码 有 许多 国际 标准 和 文件 存储 格式 ， 如 
BMP、GIF、TIFF、JPEG、JPEG 2000 等 。 

借助 于 专用 软件 可 对 图 像 进行 缩放 、 旋 转 、 变形 名 正 、 图 像 增强 和 修饰 等 滤 镜 操 
作 ， 以 提高 图 像 的 视 沉 效果 或 用 于 本 《美国 Adobe 公司 的 Photoshop 以 其 
强大 的 功能 成 为 人 们 进行 图 像 处 理 与 编辑 首选 和 NT 具 之 
视频 是 影像 视频 的 简称 。 与 动画 一 样 样 "视频 号 汪 连 续 的 随 着 时 间 变 化 的 4 图 像 (或 称 帧 ) 
组 成 。 由 于 RN 留 ” 的 生理 现象 ， 当 >1s 内 连续 播放 多 幅 相互 关联 的 静止 图 像 时 就 会 
产生 运动 的 感觉 从 即 运 动 视 频 。 因 此 ， 图 像 可 以 看 作 视频 的 特例 。 
摄像 机 是 获取 视频 信号 最 常用 的 工具 ， 根 据 摄像 机 的 类 别 ， 可 分 为 模拟 视频 与 数字 视频 。 
由 模拟 视频 转变 为 数字 视频 的 过 程 称 为 视频 的 数字 化 。 在 个 人 计算 机 中 较 常 用 的 设备 是 视频 
采集 卡 , 简称 视频 卡 。 它 能 将 输入 的 模拟 信号 (及 其 伴音 信号 ) 进 行 数字 化 , 然后 存储 在 硬盘 中 。 
于 数字 电视 、VCD、DVD 及 数字 监控 、 可 视 通 信 、 远 程 医疗 、 远 程 教学 等 视频 应 用 的 
不 断 普及 ， 大 大 推动 了 数字 视频 处 理 技术 的 研究 与 应 用 。 特 别 是 网 络 视频 和 交互 式 电 视 等 新 
的 应 用 的 出 现 ， 诞 生 了 许多 视频 处 理 、 播 放 软件 ， 以 及 支持 不 同 格式 的 视频 压缩 编码 标准 ， 
如 MPEG-1、MPEG-2、MPEG-4 和 H.261 等 。 
本 章 以 数字 图 像 处 理 为 基础 ， 首 先 介绍 数字 图 像 处 理 技术 ， 然 后 介绍 动态 视频 处 理 技术 
及 应 用 。 































































































3.2 ”数字 图 像 数 据 的 获取 与 表示 


计算 机 要 对 图 像 进行 处 理 ， 首 先 必 须 获 得 图 像 信 息 并 将 其 数字 化 。 利 用 图 像 扫描 仪 、 数 
码 照 相机 等 常用 的 图 像 输 入 设备 对 印刷 品 、 照 片 或 选 定 的 景物 进行 拍摄 ， 完 成 图 像 输 入 过 程 。 
下 面 将 介绍 数字 图 像 数 据 的 获取 与 表示 的 基本 原理 与 相关 知识 。 
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AN 
下 区 媒体 技术 及 其 应 用 (第 之 版) 
数字 图 像 数 据 的 获取 
图 像 数据 的 获取 是 图 像 数字 化 的 基础 。 图像 获取 的 过 程 实质 上 是 模拟 信号 的 数字 化 过 程 。 
它 的 处 理 步骤 大 体 分 为 3 步 。 
(1) 采样 。 将 画面 划分 为 MXN 个 网 格 ， 每 个 网 格 称 为 一 个 取样 点 ， 用 其 亮度 值 来 表示 。 
这 样 ， 一 幅 模拟 图 像 就 转换 为 MXN 个 取样 点 组 成 的 一 个 阵列 ， 如 图 3.1 所 示 。 
123 145 3210) ss 120 
210 189 310 ... ,248 
图 3.1 图 从 采样 示意 图 《< KS 
(2) 分 色 。 将 彩色 图 像 的 取样 点 的 颜色 分 解 成 3 个 基 包 (0 民 、 G、B 三 基色 )， 若 不 是 彩 





色 图 像 即 灰 度 图 像 或 时 








图 像 )， 则 每 一 个 取样 点 只 有 站 个 亮度 值 。 




















G3) 量化 。 对 采 的 每 个 分 量 进行 AD 转换 把 模拟 量 的 训 度 值 使 用 数字 量 来 表示 (一 
般 是 8 一 12 位 的 正 整 数 )。 XA 
3.2.2 数字 图 像 的 表示 | 

从 数字 图 像 的 获取 过 程 可 以 知道 汪 幅 取样 人 4 行 )x 入 ( 列 ) 个 取样 点 组 成 ， 每 个 取 























样 点 是 组 成 取样 图 像 的 基本 单位 . 称 放 像素， 黑白 图 像 的 像素 太 有 
是 矢量 ， 它 由 多 个 彩色 分 量 组 成 ，- 投 有 3 个 人 条，G 妇 





1 个 亮度 值 ， 彩 色 图 像 的 
B- 蓝 )， 因 此 ， 取 样 图 像 


在 计算 机 中 的 
表示 ， 和 矩阵 世 
素颜 色 分 量 的 


表示 方法 是 ， 音色 图 像 用 一 个 矩阵 


CN 
未 


彩色 图 像 用 一 组 (一 般 是 3 个 ) 矩 阵 来 


:为 图 像 的 水 平分 辩 素 ， 矩 阵 中 的 元 素 是 像 





行 数 称 为 图 像 的 重 直 分 辩 率 交 列 数 


- 般 感 8 一 12 位 。 彩 


色 图 像 的 表示 如 图 3.2 所 示 。 
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并 站 过 技术 | 


3.3 ”图像 的 基本 属性 


在 计算 机 中 存储 的 每 一 幅 数 字 图 像 ， 除 了 所 有 的 像素 数据 之 外 ， 至 少 还 必须 给 出 如 下 一 
些 关 于 该 图 像 的 描述 信息 (属性 )。 
3.3.1 分辨 率 

经 常用 到 的 分 辩 率 有 两 种 : 显示 分 辨 率 和 图 像 分 辩 率 。 

1， 显示 分 辨 率 

显示 分 辨 率 是 指 显示 屏 上 能 够 显示 出 的 像素 数目 。 例如， 显示 分 辨 率 为 640X480 表示 显 
示 屏 分 成 480 行 ， 每 行 显示 640 个 像素 ， 整 个 显示 屏 就 含有 307 a 显 像 点 。 屏 幕 能 够 显 
示 的 像素 越 多 ， 说 明显 示 设 备 的 分 辨 率 越 高 ， 显示 的 图 像 所 最 t 除 目前 大 多 计算 机 
用 的 液晶 显示 器 (Liquid Crystal Display，LCD) 外 ， 早 期 计 民 Mn MA: (Cathode 
Ray Tube，CRT) 显 示 ， 它 类 似 于 彩色 电视 机 中 的 CRT 显示 屏 上 的 每 个 彩色 像 点 由 代表 R、 
G 及 B 3 种 模拟 信号 的 相对 强度 决定 ， 这 些 彩 色 像 点 就 构成 一 幅 彩色 图 像 。 

计算 机 用 的 CRT 和 家 用 电视 机 用 的 CR 之 问 的 主 要 差别 是 显像管 玻璃 面 上 的 孔 眼 掩 模 

和 所 涂 的 荧光 物 不 同 。 孔 眼 之 间 的 距离 称 为 点 (Dot Pitchb)。 因 此 ， 常 用 点 距 来 衡量 一 个 显示 

屏 的 分 辨 率 。 电 视 机 用 的 CRT 的 平 习 分 辩 率 为 0.78mm， 而 标准 显示 器 的 分 辨 率 为 0.28mm。 
孔 眼 越 小 ， 分 辩 率 就 越 高 ， 这 就 需要 更 小 更 精细 的 荧光， 这 也 就 是 为 什么 同样 尺寸 的 计算 
机 显示 器 比 电视 机 的 价格 贵 得 多 的 原因 。 vw 从 

早期 用 的 计算 机 显示 :的 分 辩 率 是 0.41m 随 闭 技 术 的 进步 ， 分 辩 素 由 0.41 一 0.38 一 
035 031 028 这 刘 bj8mm WT 中 示 吕 的 和 格 主要 集中 体现 在 分 关 率 上 ， 因 此 在 购买 


Wee 上 综合 考虑 。 pm 
2， 图 像 分 辨 3 


像 分 辨 率 是 指 组 成 一 幅 图 像 的 像素 密度 的 度量 方法 。 对 同样 大 小 的 一 幅 图 ， 若 组 成 该 
图 的 图 像 像 素数 目 越 多 , 则 说 明 图 像 的 分 辩 率 越 高 , 看 起 来 就 越 逼真 ; 相反 ,图 像 显得 越 粗糙 。 
在 用 扫描 仪 扫描 彩色 图 像 时 ， 通 常 要 指定 图 像 的 分 辩 率 ， 用 每 英寸 多 少 点 (Dots Per Inch， 
DPI 表示 。 如 果 用 300dpi 来 扫描 一 幅 8"X 10" 的 彩色 图 像 ， 就 得 到 一 幅 2 400X3 000 像素 的 
图 像 。 分 辩 率 越 高 ， 像 素 就 越 多 。 
到 像 分 辩 率 与 显示 分 辩 率 是 两 个 不 同 的 概念 。 图 像 分 辨 率 是 确定 组 成 一 幅 图 像 的 像素 数 
目 ， 而 显示 分 辨 率 是 确定 显示 图 像 的 区 域 大 小 。 如 果 显 示 屏 的 分 辨 率 为 640X480 像素 ， 那么 
一 幅 320X240 像素 的 图 像 只 占 显 示 屏 的 1/4; 相反 ，2 400X3 000 像素 的 图 像 在 这 个 显示 屏 
上 就 不 能 显示 一 个 完整 的 画面 。 


3.3.2 ”像素 深度 


像素 深度 ， 即 像素 的 所 有 颜色 分 量 的 二 进 制 位 数 之 和 , 它 决 定 了 不 同 颜色 (亮度 ) 的 最 大 数 
目 。 或 者 确定 灰 度 图 像 的 每 个 像素 可 能 有 的 灰 度 级 数 。 例 如 ， 一 幅 彩 色 图 像 的 每 个 像素 用 R、 
G、B 3 个 分 量 表示 ， 若 每 个 分 量 用 8 位 ， 那 么 一 个 像素 共用 24 位 表示 ， 就 说 像素 的 深度 为 
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24， 每 个 像素 可 以 是 ?2 一 16 777 216 种 颜色 中 的 一 种 。 在 这 个 意义 上 ， 往 往 把 像素 深度 说 成 





是 图 像 深度 。 表 示 一 个 像素 的 位 数 越 多 ， 它 能 表达 的 颜色 数目 就 越 多 ， 而 它 的 深度 就 越 深 。 

虽然 像素 深度 或 图 像 深度 可 以 很 深 ， 但 各 种 VGA(Video Graphics Array， 视 频 图 形 阵列 ) 
的 颜色 深度 却 受 到 限制 。 例 如 ， 标 准 VGA 支持 4 位 16 种 颜色 的 彩色 图 像 ， 多 媒体 应 用 中 推 
荐 至 少 用 8 位 256 种 颜色 。 由 于 设备 的 限制 ， 加 上 人 眼 分 辩 率 的 限制 ， 一 般 情 况 下 ， 不 一 定 
要 追求 特别 深 的 像素 深度 。 此 外 ， 像 素 深度 越 深 ， 所 占用 的 存储 空间 越 大 。 相 反 ， 如 果 像 素 
深度 太 浅 ， 那 也 影响 图 像 的 质量 ， 图 像 看 起 来 让 人 觉得 很 粗糙 也 很 不 自然 。 

在 用 二 进 制 数 表示 彩色 图 像 的 像素 时 ， 除 R、G、B 分 量 用 固定 位 数 表 示 外 ， 往 往 还 增加 
1 位 或 几 位 作为 属性 (Attribute) 位 。 例 如 ，RGB 5 : 5 : 5 表示 一 个 像素 时 ,用 2 个 字 节 共 16 位 
表示 ， 其 中 R、G 及 B 各 占 5 位 ， 剩 下 一 位 作为 属性 位 。 在 这 种 情况 下 ， 像 素 深度 为 16 位 ， 
而 图 像 深度 为 15 位 。 
属性 位 用 来 指定 该 像素 应 具有 的 性 质 。 例 如 ， 在 CD-I 系统 申 ; 用 RGB 5 : 5 :5 表示 的 
像素 共 16 位 ， 其 最 高 位 (bs) 用 作 属性 位 ， 并 把 它 称 为 透明 (Tra 位 ， 记 为 T。7 的 含 
义 可 以 这 样 来 理解 : 假如 显示 屏 上 有 一 幅 图 ， 当 这 幅 图 或 者 这 幅 图 的 一 部 分 要 重 吞 在 上 面 时 ， 
了 位 就 用 来 控制 原 图 是 否 能 看 得 见 。 例 如 ， 定 义 7 二 1 站 原 图 完全 看 不 见 ; T=0， 原 图 能 完全 
看 见 。 SS 

在 用 32 位 表示 一 个 像素 时 ,， 若 R、G、 B 分 别 用 8 位 表示 ， 剩 下 的 8 位 常 称 为 a 通道 位 ， 
或 称 为 覆盖 位 、 中 断 位 、 属 性 位 。 它 的 用 法 可 用 -个 预 乘 a 通道 (Premultiplied Alpha) 的 例子 
说 明 。 假 如 一 个 像素 (A，R、G、 A be ee (A，R、G、B) 为 (1， 
1，0，0) 时 显示 红色 。 当 像素 为 (0551> 0，0) 时 ， 预 乘 的 结果 就 变 成 (.5，0.5，0，0)， 这 表 
示 原 来 该 像素 显示 的 红色 的 强 谍 沪 1; 而 现在 显示 的 红色 的 强度 降 了 一 半 。 

用 这 种 办 法 定义 一 个 素 的 属性 在 实际 中 和 有 用 尺 例如， 在 一 幅 彩 色 图 像 上 全 加 文字 说 
明 ， 而 又 不 想 让 文字 把 图 获 盖 掉 ， 就 可 以 用 这 法 来 定义 像素 ， 而 该 像素 显示 的 颜色 又 有 
人 把 它 称 为 混合 色 (Key Colon 。 在 图 像 产品 生产 中 ， 也 往往 把 数字 电视 图 像 和 计算 机 生产 的 
图 像 混合 在 - -起 ) i 种 技术 称 为 视图 混合 (Video Keying) 技 术 ， 它 也 采用 a 通道 。 


3.3.3 ”颜色 空间 


颜色 空间 的 类 型 ， 指 彩色 图 像 所 使 用 的 颜色 描述 方法 ， 也 称 颜色 模型 。 一 个 能 发 出 光波 
的 物体 称 为 有 源 物体 ， 它 的 颜色 由 该 物体 发 出 的 光波 决定 ， 使 用 RGB 相 加 混 色 模型 ， 一 个 不 
发 光波 的 物体 称 为 无 源 物体 ， 它 的 颜色 由 该 物体 吸收 或 者 反射 哪些 光波 决定 ， 用 CMY 相 减 
混 色 模型 。 
1， 显示 彩 色 图 像 用 颜色 模型 


显示 彩色 图 像 的 电视 机 和 计算 机 显示 器 色彩 显示 原理 主要 基于 图 像 的 颜色 模型 。 在 此 类 
装置 中 , 使 用 的 阴极 射线 管 (CRT) 是 一 个 有 源 物体 。CRT 使 用 3 个 电子 枪 分 别 产生 红 、 绿 和 蓝 
3 种 波长 的 光 ， 并 以 各 种 不 同 的 相对 强度 综合 起 来 产生 颜色 ， 如 图 3.3 所 示 。 组合 这 3 种 光波 
以 产生 特定 颜色 称 为 相 加 混 色 ， 又 称 RGB 相 加 模型 。 相 加 混 色 是 计算 机 应 用 中 定义 颜色 的 基 
本 方法 。 

从 理论 上 讲 ， 任 何 一 种 颜色 都 可 用 3 种 基本 颜色 按 不 同 的 比例 混合 得 到 。3 种 颜色 的 光 
强 越 强 ， 到 达 我 们 眼睛 的 光 就 越 多 ， 它 们 的 比例 不 同 ， 我 们 看 到 的 颜色 也 就 不 同 ， 没 有 光 到 
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达 眼 睛 ， 就 是 一 片 漆黑 。 当 三 基色 按 不 同 强度 相 加 时 ， 总 的 光 强 增强 ， 并 可 得 到 任何 一 种 颜 
色 。 某 一 种 颜色 和 这 3 种 颜色 之 间 的 关系 可 用 下 面 的 式 子 来 描述 。 
颜色 王 R( 红 色 的 百分比 ) 十 G( 绿 色 的 百分比 ) 十 B( 蓝 色 的 百分比 ) 
当 三 基色 等 量 相 加 时 ， 得 到 白色 ; 等 量 的 红 绿 相 加 而 蓝 为 0 值 时 得 到 黄色 ; 等 量 的 红 蓝 
相 加 而 绿 为 0 时 得 到 品 红 色 ; 等 量 的 绿 蓝 相 加 而 红 为 0 时 得 到 青色 。 这 些 三 基色 相 加 的 结果 
如 图 3.4 所 示 。 
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图 3.3 ”彩色 显像管 产生 颜色 的 原理 | 图 3.4 混 色 相 加 
一 幅 彩 色 图 像 一 个 像素 值 往往 用 3 个 分 量 及 、.G 及 B 表示 。 如 果 每 个 像素 的 每 个 颜色 分 
量 用 二 进 制 的 1 位 来 表示 ， 那 么 每 个 颜色 的 分 量 只 有 “1” 和 “0” 这 两 个 值 。 这 也 就 是 说 ， 
每 种 颜色 的 强度 是 100%， 或 者 是 0。' 在 这 种 情况 下 ， 每 个 像素 所 显示 的 颜色 是 8 种 可 能 出 现 
的 颜色 之 一 ， 见 表 3-1。 


表 3-1 相 加 色 ， 
RGB RGB 颜色 
000 100 红 
001 101 品 红 
010 110 黄 
011 111 白 








对 于 标准 的 电视 图 形 阵列 适 配 卡 的 16 种 标准 颜色 ， 其 对 应 的 R、G、B 值 见 表 3-2。 在 
Microsoft 公司 的 Windows 操作 系统 中 ， 用 代码 0 一 15 表示 。 在 表 中 ， 代 码 1 一 8 表示 的 颜色 
比较 暗 ， 它 们 是 用 最 大 光 强 值 的 一 半 产 生 的 颜色 ; 9 一 15 是 用 最 大 光 强 值 产生 的 。 


表 3-2 16 色 VGA 调 色 板 的 值 
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于 术 用 其 应 用 (第 之 县) 
代码 R G 3 上 颜色 
6 128 128 240 60 褐色 
Ea 192 192 0 180 白 
8 128 128 0 120 深 灰 
9 0 0 240 120 淡 蓝 
10 0 255 240 120 淡 绿 
11 0 2 好 240 120 淡 青 
12 255 0 240 120 淡 红 
13 255 0 240 120 淡 品 红 
14 255 255 240 120 黄 
15 255 255 255 0 240 高 亮 白 
在 表 3-2 中 ， 每 种 基色 的 强度 是 用 8 位 表示 的 ， 因此 可 产生 224 一 16 777 216 种 颜色 。 但 
实际 上 要 用 1 600 多 万 种 颜色 的 场合 是 很 少 的 。 在 多 媒体 计算 机 中 ， 除 用 RGB 来 表示 图 像 之 
外 ， 还 用 色调 一 饱和 度 一 亮度 (Hue-Saturation-Lightness，HSL) 颜 色 模 型 。 


在 HSL 模型 中 ，H 定义 颜色 的 波 ] 
; 工 定义 扒 入 的 自 光量 ， 


程度 ， 称 为 饱和 度 














因此 在 Windows 中 也 








光 的 效果 ;降低 亮度 时 ， 颜 色 
HS 未 示 法 。 侈 


2， 打 印 彩色 图像 用 BRMY 御 浅 混 色 模型 





用 彩色 黑 水 或 颜料 进 


都 可 以 用 3 种 基本 颜料 按 - 定 比 例 混合 得 到 二 这 3 种 颜色 是 青色 (Cyan)、 品 红 (Magenta) 币 
色 (Yellow)， 通 常 写 成 CMY， 称 为 CMY 模型 。 用 这 种 方法 产生 
颜色 之 所 以 称 为 相 减 色 ， 是 因为 它 减少 了 为 视觉 系统 识别 颜 
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已 

















行 混合 ， 这 样 得 到 的 颜色 称 为 相 减 








要 的 反射 光 。 
在 相 减 混 色 中 ， 当 三 基色 等 量 相 减 时 
品 红 (M) 相 减 而 青色 (C) 为 0 时 ， 得 到 红 { 








长 ， 称 为 色调 ; S 定义 颜色 的 强度 (Intensity)， 表 示 颜 
称 为 亮度 。 用 HSL 表示 颜色 的 重要 性 ， 

较 容易 为 画家 所 理解 。 若 把 SS 和 了 的 值 设置 为 1， 当 改变 再 时 就 是 选择 不 同 的 纯 颜 
\ 饱 和 度 S 时 ， 就 可 体现 掺 入 白 


| 
已 


是 





就 暗 ， 相 当 于 掺 入 黑色 。 


色 。 在 理论 上 说 ， 任 何 一 种 颜色 
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黄 
E 的 
色 所 需 











得 到 黑色 ;等 量 黄色 (Y) 
色 (R); 等 量 青 色 (C) 和 品 













































































红 (M) 相 减 而 黄色 (Y) 为 0 时 ， 得 到 蓝 色 (B); 等 量 黄色 (Y) 和 青色 (C) 
图 3.5 三 基色 相 减 模型 相 减 而 品 红 (M) 为 0 时 ， 得 到 绿色 (G)。 这 些 三 基色 相 减 结果 如 图 3.5 
T 不 。 
3.3.4 真 彩色 、 伪 彩色 与 直接 色 
真 彩色 、 伪 彩色 与 直接 色 是 图 像 又 一 重要 的 属性 。 理 解 这 些 属性 的 含义 ， 对 于 编写 图 像 
显示 程序 ， 理 解 图 像 文 件 的 存储 格式 均 有 一 定 的 指导 意义 。 
1. 真 彩色 
真 彩色 (True Color) 是 指 在 组 成 一 幅 彩 色 图 像 的 每 个 像素 值 中 , 有 R、G、B 3 个 基色 分 量 ， 
每 个 基色 分 量 直接 决定 显示 设备 的 基色 强度 , 这 样 产生 的 彩色 称 为 真 彩色 。 例如 , 用 RGB 5 : 
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5 : 5 表示 的 彩色 图 像 ，R、G、B 各 用 5 位 ， 用 R、G、B 分 量 大 小 的 值 直接 确定 3 个 基色 的 
强度 ， 这 样 得 到 的 彩色 是 真实 的 原 图 彩色 。 

如 果 用 RGB 8 : 8 : 8 方式 表示 一 幅 彩 色 图 像 ， 就 是 R、G、B 都 用 8 位 来 表示 ， 每 个 基 
色 分 量 占 一 个 字 节 ， 共 3 个 字 节 ， 每 个 像素 的 颜色 就 是 由 这 3 个 字 节 中 的 数值 直接 决定 ， 如 
图 3.6(a) 所 示 ， 可 生成 的 颜色 数 就 是 24 二 16 777 216 种 。 用 3 个 字 节 表示 的 真 彩色 图 像 所 需 
要 的 存储 空间 很 大 ， 而 人 的 眼睛 是 很 难 分 辨 出 这 么 多 种 颜色 的 ， 因 此 在 许多 场合 往往 用 RGB 
5 :5 :5 来 表示 ， 每 个 彩色 分 量 占 5 个 位 ， 再 加 1 位 显示 属性 控制 位 共 2 个 字 节 ， 生 成 的 真 
颜色 数目 为 25 一 32 768 种 。 

在 许多 场合 ， 真 彩色 图 通常 是 指 RGB 8 : 8 : 8， 即 图 像 的 颜色 数 等 于 224， 也 常 称 为 全 彩 
色 (Full ColonD 图 像 。 但 在 显示 器 上 显示 的 颜色 就 不 一 定 是 真 彩色 ， 要 得 到 真 彩 色 图 像 需要 有 
真 彩色 显示 适配器 。 
2， 伪 彩色 ， 1 
伪 彩 色 (Pseudo tie th hr 的 数值 直接 决 
定 ， 而 是 把 像素 值 当 作 彩色 查找 表 (Color Look-Up 加 T) 的 表 项 入 口 地 址 ， 去 查找 一 
个 显示 图 像 时 使 用 的 R、G、B 强度 值 ， 用 查找 出 的 RN B 强度 值 产 生 的 彩色 称 为 伪 彩 色 。 

彩色 查找 表 CLUT 是 一 个 事先 做 好 的 表 ， 表 项 入 口 地 址 也 称 为 索引 号 。 例如 ，16 种 颜色 
的 查找 表 ，0 号 索引 对 应 黑色 ，15 号 索引 对 应 上 。 彩 色 图 像 本 身 的 像素 数值 和 彩色 查找 表 
的 索引 号 有 一 个 变换 关系 ， 这 个 关系 可 以 使 Windows 系统 中 定义 的 变换 关系 ,也 可 以 使 用 
用 户 自己 定义 的 变换 关系 。 使 用 查找 得 到 的 数值 显示 的 彩色 是 真 的 ， 但 不 是 图 像 本 身 的 真正 
颜色 ， le TS MX Wx 

KGL 


cu ~ 八 











































































































































































才 色 查找 
B (CLUP) 








tb) 的 彩色 示意 图 
图 3.6 真 彩色 和 伪 彩 色 图 像 之 间 的 差别 


3. 直接 色 


每 个 像素 值 分 成 R、G、B 分 量 ， 每 个 分 量 作为 单独 的 索引 值 对 它 做 变换 。 也 就 是 通过 相 
应 的 彩色 变换 表 找 出 基色 强度 , 用 变换 后 得 到 的 RR、G、B 强度 值 产生 的 彩色 称 为 直接 色 (Direct 
Color)。 它 的 特点 是 对 每 个 基色 进行 变换 。 
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一 多 苦 你 乒 林 及 站 应 用 (第 二 县) 
这 种 系统 产生 颜色 与 真 彩色 系统 相 比 , 相同 之 处 是 都 采用 R、G、B 分 量 决定 基色 强度 ， 
































不 同 之 处 是 前 者 的 基色 强度 直接 用 R、G、B 决定 ， 而 后 者 的 基色 强度 由 R、G、B 经 变换 后 
决定 。 因 而 这 两 种 系统 产生 的 颜色 就 有 差别 。 试 验 结果 表明 ， 使 用 直接 色 在 显示 器 上 显示 的 


彩色 图 像 看 起 来 真实 、 自 然 。 
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科 
量 分 别 进行 变换 ， 后 者 是 把 整个 像素 当 作 查找 表 的 索引 值 进 行 彩色 变换 。 
常 






































系统 与 伪 彩 色 系统 相 比 ， 相 同 之 处 是 都 采用 查找 表 ， 不 同 之 处 是 前 者 对 R、G、B 分 

















像 文件 的 格式 
像 是 一 种 普遍 使 用 的 数字 媒体 ， 有 着 广泛 的 应 用 。 多 年 来 不 同 公司 开发 了 许多 图 像 应 






























































文件 是 一 种 通用 的 图 像 文 件 格式 ， 几 乎 所 有 Windows 























用 软件 , 再 加 上 应 用 本 身 的 多 样 性 , 因此 出 现 了 许多 不 同 的 图 像 文 件 格式 , 常用 的 有 以 下 几 种 。 




















. BMP 格式 
BMP 图 像 是 Microsoft 公司 在 Windows 操作 系统 下 使 用 的 入 图像 文件 格式 ， 一 个 















































文件 存放 一 幅 图 像 , 可 以 使 用 行程 长 度 编码 (RLC) 进 行 3 Sb 可 不 压缩 。 不 压缩 的 BMP 


i i 


都 能 支 

2. TIFF 格式 NS ~ 

TIFF(Tagged Image File Format, a 和 桌面 出 版 ， 能 支 
图 像 图 形 应 用 软件 支持 这 种 文件 格式 。 

3，GIF 格式 ,> xXN、 

GIF(Graphics Interohange Pog iatj 是 目 有 前 mntemet 广泛 使 用 的 - 一 种 图 像 文 件 格式 , 它 的 颜 





色 数 目 较 少 (不 超过 256 名) 文件 特别 小 ， 适合 网 络 传输 ?由 于 颜色 数目 有 限 ，GIF 适用 于 插 


图 、 


大 量 


产生 





剪贴 本 等 色 允 数 目 不 多 的 应 用 场合 。 GIE_ E 够 支持 透明 背景 ， 具 有 在 屏幕 上 渐进 显 


示 的 功能 。 尤 实 由 斩 是 ， 它 可 以 将 许多 张 图 像 保 存在 同一 个 文件 中 ， 显 示 时 按 预 先 规定 的 
时 间 间 隔 逐 一 


示 ， 从 而 形成 动画 的 效果 ， 因 而 在 网 页 制作 中 大 量 使 用 。 
4.JPEG 格式 


JPEG 格式 是 最 流行 的 压缩 图 像 文 件 格式 ， 采 用 静止 图 像 数 据 压缩 编码 的 国际 标准 压缩 ， 
用 于 Internet 和 数码 照相 机 等 。 

















3.4 图 像 处 理 软件 Photoshop 应 用 举例 





























到 像 的 数字 化 为 图 像 处 理 葛 定 了 必要 的 基础 ， 由 于 不 同 领域 对 图 像 处 理 各 种 应 用 的 需要 
了 许 许 多 多 图 像 处 理 软 件 。 在 众多 图 像 处 理 软件 中 ，Photoshop 成 为 个 人 计算 机 上 使 用 最 
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3.4.1 








泛 的 应 用 软件 之 
图 像 处 理 软件 Photoshop 简介 
Photoshop 是 美国 Adobe 公司 开发 的 真 彩色 和 灰 度 图 像 编辑 处 理 软 件 , 它 提供 了 多 种 图 像 












































涂抹 、 修 饰 、 编 辑 、 创 建 、 合 成 、 分 色 与 打印 的 方法 ， 并 给 出 了 许多 增强 图 像 的 特殊 手段 ， 











可 | 


| 
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泛 地 应 用 于 美工 设计 、 广 告 及 桌面 印刷 、 计 算 机 图 像 处 理 、 旅 游 风 光 展 示 、 动 画 设计 、 








六 六 站 过 技术 | 


影视 特技 等 领域 ， 是 计算 机 数字 图 像 处 理 的 有 力 工具 。Adobe Photoshop 自问 世 以 来 就 以 其 在 
图 像 编辑 、 制 作 和 处 理 方面 的 强大 功能 和 易 用 性 、 实 用 性 而 备 受 广大 计算 机 用 户 的 青睐 。 
Photoshop 在 图 像 处 理 方面 ， 被 认为 是 目前 世界 上 最 优秀 的 图 像 编辑 软件 之 一 ， 运行 在 
Windows 图 形 操作 环境 中 ， 可 在 Photoshop 和 其 他 标准 的 Windows 应 用 程序 之 间 交 换 图 像 数 
据 。Photoshop 支持 TIF、TGA、PCX、GIF、BMP、PSD、JPEG 等 各 种 流行 的 图 像 文 件 格式 ， 
能 方便 地 与 文字 处 理 、 图 形 应 用 、 桌 面 印刷 等 软件 或 程序 交换 图 像 数据 。Photoshop 支持 的 图 
像 类 型 除 常见 的 黑白 、 灰 度 、 索 引 16 色 、 索 引 256 色 和 RGB 真 彩色 图 像 外 ,还 支持 CMYK、 
HSB 及 HSV 模式 的 彩色 图 像 。 
作为 图 像 处 理工 具 ，Photoshop 着 重 在 效果 处 理 上 ， 即 对 原始 图 像 进行 艺术 加 工 ， 并 有 一 
定 的 绘图 功能 。Photoshop 能 完成 色彩 修正 、 修 饰 缺陷 、 合 成 数字 图 像 ， 以 及 利用 自 带 的 过 滤 
器 来 创造 各 种 特殊 的 效果 等 。Photoshop 擅长 利用 基本 图 像素 材 (如 通过 扫描 、 数 字 相 机 或 摄 
像 等 手段 获得 图 像 ) 进 行 再 创作 ， 得 到 精美 的 设计 作品 。 和 
Adobe 公司 又 专门 针对 中 国 用 户 对 其 最 新 的 Photoshop SS 全 面 汉 化 , 使 得 这 一 图 
像 处 理 的 利器 更 容易 被 人 们 所 掌握 和 使 用 。 
a 


3.4.2 ”Photoshop 的 运行 界面 A A 


Photoshop 的 界面 和 大 多 数 Windows 庙 几 要 遍 ， 有 菜单 栏 和 状态 栏 ， 也 有 它 独特 芯 
组 成 部 分 ， 如 工 具 箱 属性 栏 和 浮动 面板 等 ， 如 图 3.7 所 示 。 
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图 3.7 Photoshop 工作 界面 


(1) 菜单 栏 。 Photoshop 的 菜单 栏 中 包括 9 个 主 菜单 ， Photoshop 的 绝 大 多 数 功能 都 可 以 通 

(2) 工具 箱 。 Photoshop 的 工具 箱 中 提供 了 20 多 组 工具 , 用户 可 以 利用 这 些 工具 轻松 地 复 
制 和 编辑 图 像 。Photoshop 把 功能 基本 相同 的 工具 归 为 一 组 , 工具 箱 中 凡是 带 下 三 角 符 的 工具 
都 是 复合 工具 ， 表 示 在 该 工具 的 下 面 还 有 同类 型 的 其 他 工具 存在 。 如 果 要 使 用 这 组 中 其 他 的 
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Ee 下 | 巡 体 找 坟 肥 其 应 用 第 之 服 ) 
“_ 拉 钮 ， 音 击 此 按 乌 ， 将 会 弹出 整个 接 馈 组 。 

G) 属性 栏 。 属性 栏 的 内 容 是 与 当前 使 用 的 工具 相关 的 一 些 选项 内 容 。 在 工具 箱 中 选 不 同 
的 工具 ， 属 性 栏 就 会 显示 不 同 的 选项 设置 供用 户 设置 。 

(4) 状态 栏 。 状 态 栏 提供 目前 工作 使 用 的 文件 的 大 多 数 信息 ， 如 文件 大 小 、 图 像 的 缩放 比 
例 及 当前 工具 的 简要 用 法 等 。 

(5) 图 像 窗口 。 图像 窗口 是 为 编辑 图 像 而 创建 的 窗口 ,每 一 个 打开 的 图 像 文件 都 有 自己 的 
编辑 窗口 ， 所 有 编辑 操作 都 要 在 编辑 窗口 中 进行 才能 完成 。 

(6) 工作 区 。 图 像 处 理 的 场所 。Photoshop 可 以 同时 处 理 多 个 图 像 ， 即 在 工作 区 中 可 以 同 
时 有 多 个 图 像 窗口 。 

(07) 浮动 面板 。 在 Photoshop 中 提供 了 十 几 种 面板 ， 其 中 包括 图 层面 板 、 颜 色 面 板 、 风 格 
面板 、 历 史记 录 面 板 、 动 作 面板 、 通 道 面板 等 。 通 过 这 些 面板 ， 用 户 可 以 快速 便捷 地 对 图 层 、 








颜色 、 动 作 、 


1. 图 层 


在 Photoshop 中 ， 图 层 是 





， 图 层 概念 的 引入 ， 








在 每 一 层 上 都 可 以 绘图 ， 
因此 , 在 Photoshop 中 

。 若干 图 层 重生 在 一 起 
ee 
挡 位 于 其 底下 的 图 层 | 











云 里 登 











通道 等 进行 操作 和 管理 。 
3.4.3 ”Photoshop 的 图 层 与 沽 镜 


组 可 以 用 ada 


部 分 ， 可 以 看 到 下 面 
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SS 
一 个 极 富 创 意 的 功 ee 进行 图 像 处 理 的 高 级 技术 之 
给 图 像 的 编辑 处 理 带 大 的 便利 
像 的 透明 层 。 可 以 将 图 层 想像 为 一 组 透明 的 胶片 ， 
es 起 语 ， 从 上 看 下 去 ， 沽 到 的 就 是 合 成 的 图 像 效 果 。 
et 县 构成 一 个 图 层 都 有 自己 的 图 像 信 


层 中 没有 图 像 的 部 分 是 透明 的 ， 

图 像 ， 图 层 上 有 图 像 信 息 的 部 分 将 谈 
图 层 之 问 是 有 顺序 的 > 修改 图 层 之 间 的 顺序 ， 国信 驶 本 肥 用 从 
当前 图 层 ”， 以 蓝 色 表示 ， 修 改 时 ， 


5 ea 像 ， 

















只 会 














响 当 前 图 层 ， 而 不 影响 


生变 化 。 人 称 演 “ 


其 他 图 层 的 图 像 信 息 ， 如 果 当 前 图 层 有 选区 的 话 ， 作 用 范围 将 进 消 











缩小 为 “当前 图 层 的 当前 
2. 渡 镜 





滤 镜 是 Photoshop 的 特色 之 一 。 利 用 Photoshop 提供 的 各 种 滤 镜 ， 可 以 制作 出 各 种 令 人 眼 


花 综 乱 的 图 像 效 果 。 


Photoshop 中 的 滤 镜 可 以 分 为 两 种 : 
可 以 在 滤 镜 菜单 下 看 到 。 





装 了 Photoshop 之 后 ， 
都 可 以 产生 神奇 的 效果 。 


一 种 是 Photoshop 自己 内 部 带 的 滤 镜 ， 这 些 滤 镜 在 安 
Photoshop 提供 了 近 百 种 内 置 的 滤 镜 ， 每 一 种 
另 一 种 是 由 第 三 方 开发 的 外 挂 滤 镜 ， 这 种 滤 镜 在 安装 了 Photoshop 


后 ， 还 需要 另外 安装 这 些 滤 镜 后 才 可 以 使 用 。 


根据 滤 镜 的 效果 不 同 ，Photoshop 中 的 滤 镜 分 为 两 种 : 一 种 是 破坏 性 滤 镜 ; 一 种 是 校 


3.4.4 Photoshop 应 
































正 性 





举例 





利用 Photoshop 对 图 像素 材 进 行 各 种 编辑 , 可 产生 让 人 赏心悦目 的 视觉 效果 。 下 面 略 举 几 








例 加 以 说 明 。 
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第 3 章 有 四 


AS rr 


数字 图 像 与 视频 处 理 技术 





【 例 3.1】 制作 晕 映 效果 

曙 映 (Vignettss) 效 果 是 指 图 像 具 有 柔软 渐变 的 边缘 效果 ， 如 图 3.8 所 示 。 使 用 Photoshop 
制作 曼 映 效果 主要 是 使 用 选区 的 羽化 (Feathen 特 性 形成 的 。Feather 值 越 大 ， 晕 映 效果 越 明 显 。 
任意 形状 的 晕 映 效果 可 以 先 利 用 快速 遮 罩 建 立 一 个 形状 不 规则 的 选区 ， 然 后 进行 反选 、 羽 化 、 
填充 即 可 ， 操 作 步骤 如 下 。 

(1) 使 用 Photoshop 打开 一 幅 图 像 ， 如 图 3.9(a) 所 示 。 

(2) 在 工具 栏 中 选择 椭圆 套 索 工 具 。 

(3) 用 椭圆 套 索 工具 在 图 像 中 选取 所 需 的 部 分 ， 如 图 3.9(a) 所 示 。 

(4) 选择 “选择 ”一 “修改 ”一 “羽化 ”选项 ， 设 置 羽化 值 为 40 pixels。 

(5) 选择 “选择 ”一 “ 反 向 ”选项 或 按 ShiftrCtrl+I 组 合 键 来 反 转 选择 区 域 ， 如 图 3.9(b) 
所 示 。 A 

























































































SS 人 @) 套 案 工具 选择 对 象 。 。(b) 反 转 选择 区 域 
图 3.8 要因 身 效果 示例 ， > ,六 > 反 转 选 择 区 域 示例 


(6) 设置 背景 色 ， 轨 白色 Kx 

(7) 按 Delete 键 用 背 售 色 填 充 选择 区 域 ， E_n 

【 例 3.2】 制作 倒影 效果 

在 PhotosboD 图 像 制作 过 程 中 ， a 有 时 需要 制作 图 像 的 倒影 。 其 实 ， 
倒影 的 制作 主要 是 用 图 层 的 功能 。 倒 影 其 实 是 原 图 像 的 一 个 复制 ， 只 是 考虑 到 它们 之 间 的 映 
象 关 系 ， 所 以 对 它 进 行 了 垂直 翻转 。 另 外 ， 通 常 倒影 一 般 要 比 原 图 像 模糊 些 ， 所 以 使 用 模糊 
滤 镜 进行 模糊 处 理 。 使 用 Photoshop 制作 倒影 很 简单 。 例 如 ， 在 图 3.10 中 ， 利 用 Photoshop 
可 将 (b) 图 中 的 小 狗 添 加 到 (a) 图 中 ， 由 于 是 在 水 边 ， 所 以 在 制作 时 要 考虑 给 第 二 只 小 狗 制 作 水 
中 倒影 。 图 像 合成 并 制作 倒影 效果 后 的 图 像 ， 如 图 3.10(c) 所 示 操 作 步 骤 如 下 。 
(1) 使 用 Photoshop 打开 图 3.10(b) 所 示 的 小 狗 图 片 。 
(2) 在 工具 栏 中 选择 磁性 套 索 工具 ， 选 择 其 中 的 小 狗 部 分 ， 利 用 Ctrl+C 组 合 键 复制 选中 
的 部 分 

(3) 选择 “文件 ”一 “打开 ”选项 ， 打 开 “ 打 开 ” 对 话 框 ， 选 择 图 3.10(a) 所 示 的 图 片 ， 
单 击 “ 打 开 ” 按 钮 。 

(4) 在 新 打开 的 图 片 中 ， 选 择 “ 编 辑 ” 一 “粘贴 ”选项 ， 并 移 到 如 图 3.10(c) 所 示 的 合适 
位 置 。 

(5) 在 图 3.10(a) 图 层 ， 选 择 “ 编 辑 ” 一 “变换 ”一 “垂直 翻转 ”选项 。 将 翻转 后 的 
放置 在 图 中 倒影 的 位 置 ， 并 修改 图 层 的 不 透明 度 为 50%。 
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(a) 水 边 小 狗 (b) 小 狗 (c) 图 像 合成 并 制作 倒影 效果 
图 3.10 ”制作 倒影 效果 示例 


【 例 3.3】 制作 雨中 摄影 效果 

在 Photoshop 图 像 制 作 过 程 中 , 可 对 一 幅 已 有 的 图 像 加 上 下 雨 的 特效 , 给 人 一 种 雨中 摄影 
的 效果 ， 如 图 3.11 所 示 ， 操 作 步 又 如 下 。 

(1) 使 用 Photoshop 打开 图 3.11 所 示 的 人 像 图 片 。 

(2) 新 建 一 个 图 层 ， 并 填充 为 黑色 。 A 

(3) 选择 “ 滤 镜 ”一 “像素 化 ”一 “点 状 化 ”选项 寺 设 置 单 元 格 大 小 为 8。 

(4) 选择 “ 滤 镜 ”一 “模糊 ”一 “动感 模糊 ” 选 现 ， 设 置 角度 为 一 60”， 距 离 为 98 像素 。 

(5) 在 图 层面 板 中 ， 设 置 该 图 层 的 混合 模式 为 “ 滤 色 ”。 

(6) 根据 实际 需要 调整 该 图 层 的 亮度 /对 比 度 。 





(a) 原 图 像 (b) 雨中 摄影 效果 


3.11 制作 雨中 摄影 效果 示例 


Photoshop 是 一 个 功能 很 强 的 图 像 编 辑 软件 ， 有 兴趣 的 读者 可 查阅 相关 书籍 ， 自 己 上 机 动 
手 做 一 做 。 因 篇 幅 所 限 ， 此 处 不 再 装 述 。 


3.5 ”视频 的 基本 知识 








一 般 说 来 ， 视 频 信 号 是 指 连 续 的 随 着 时 间 变 化 的 一 组 图 像 (24 帧 8$、25 帧 /s、30 帧 /8)， 又 
称 运动 图 像 或 活动 图 像 。 人 们 需 对 视频 信息 进行 记录 、 存 储 、 传 输 和 播放 。 常 见 的 有 电影 、 
电视 和 动画 。 视 频 信号 按 其 特点 可 分 为 模拟 和 数字 两 种 形式 。 


3.5.1 视频 信号 的 
1. 模拟 视频 
迄今 为 止 ， 绝 大 多 数 视频 的 记录 、 存 储 和 传输 仍 是 模拟 方式 。 例 如 ， 人 们 在 电视 机 上 所 
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。_ 笋 的 一 半 ， 第 二 场 扫描 总 行 数 的 另 一 半 。 图 3.14 的 隔行 扫描 中 ， 要 求 第 一 场 结束 于 最 后 一 生 





的 一 半 ， 不 管 电子 束 如 何 折 回 ， 它 必须 回 到 显示 屏 顶 部 的 中 央 ， 这 样 就 可 以 保证 相 邻 的 第 二 
场 扫描 恰好 嵌 在 第 一 场 各 扫描 线 的 中 间 。 正 是 由 于 这 个 原因 ， 才 要 求 总 的 行 数 必须 是 奇数 。 























co wh wb 








图 3.14 隔行 扫描 SC 


每 秒 扫描 多 少 行 称 为 行 频 亡 ;每 秒 扫描 多 少 声称 为 让 每 秒 扫描 多 少 帧 称 为 帧 频 不。 
大和 矿 是 两 个 不 同 的 概念 。 AAA 

计算 机 行业 对 高 分 辩 率 采用 逐 行 扫描 的 At 为 470 电视 行业 使 用 2 ; 1 隔行 扫描 ， 其 间 
依次 对 称 为 肖 数 场 和 介 数 场 的 尚 数 和 和 个 数 入 进行 扫描 。 这 样 做 目的 是 在 一 个 固定 带宽 下 可 
降低 闪烁 。 因 为 心理 视觉 研究 表明 : 如 时 是 示 的 刷新 率 每 秒 大 于 50 次 ， 人 了 眼 就 不 会 感到 光 闪 
烁 变化 。 而 电视 系统 若 虹 要 采用 训 的 丫 素 义 要 维持 高 分 关 素 就 需要 一 个 大 的 传输 带宽 ， 而 





采用 隔行 扫描 可 以 实现 在 不 增 吉 传 给 带 鹤 前 提 下 ， 订 低 内 时 > 

3. 视频 信 号 的 空间 特性 _ XYKd4 本 
由 光村 措 所 得 的 视频 信息 aa 所 涉及 的 主要 概念 有 以 下 几 个 。 
) Bi 
扫描 处 理 中 沁 个 重要 参数 是 1 长 宽 比 (Aspla Ratio)， 即 图 像 水 平 扫描 线 的 长 度 与 图 像 竖 直 
方向 所 有 扫描 线 所 覆盖 距离 的 比 。 它 也 可 被 认为 是 一 帧 宽 与 高 的 比 。 电 视 的 长 宽 比 是 标准 化 
的 ， 早期 为 4: 3 或 16 : 9。 其 他 系统 如 电影 利用 了 不 同 的 长 宽 比 ， 有 的 高 达 2 
2) 同步 
假如 视频 信号 被 用 于 调节 阴极 射线 管 电子 束 的 亮度 时 ， 它 能 以 和 传感器 恰好 一 样 的 方式 
被 扫描 , 重新 产生 原始 图 像 ( 显 示 扫描 的 原始 图 像 ), 这 在 家 用 电视 机 和 视频 监视 器 中 能 精确 地 
进行 。 因 此 ， 电 子 信号 被 送 到 监视 器 必须 包含 某 些 附加 的 信息 ， 以 确保 监视 器 扫描 与 传感器 
的 扫描 同步 (Synchronization)。 这 个 信息 被 称 为 同步 信息 ， 由 水 平和 垂直 时 间 信 号 组 成 。 在 空 
阶 期 ， 它 或 许 包括 视频 信号 自身 ， 或 许 在 一 个 电缆 上 被 分 开 传送 ， 传 送 的 这 些 信 息 恰 好 就 是 
同步 信息 。 
3) 水 平分 辩 率 
当 摄 像 机 扫描 点 在 线 上 横向 移动 时 ， 传 感 器 输出 的 电子 信号 连续 地 变化 以 反映 传感器 所 
见 图 像 部 分 的 光亮 程度 。 扫 描 特性 的 测量 是 用 所 持 系统 的 水 平分 辨 率 (Horizontal Resolution) 
来 刻画 的 。 它 依赖 于 扫描 感光 点 的 大 小 。 为 了 测试 一 个 系统 的 水 平分 辨 率 ， 即 测量 其 重新 产 
生 水 平 线 的 精细 程度 的 能 力 ， 通 常 将 一 些 靠 得 很 近 的 竖 直 线 放 在 摄像 机 前 面 。 如 果 传 感 器 区 
域 小 于 竖 直 线 之 间 的 空隙 时 ， 这 些 线 将 重新 产生 ， 但 当 传 感 器 区 域 太 大 时 ， 产 生 的 是 平均 信 
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号 ， 将 看 不 到 这 些 线 的 输出 信号 。 

为 了 取得 逼真 的 测量 效果 ， 水 平分 辩 率 必须 与 图 像 中 的 其 他 参数 相 联 系 。 在 电视 工业 中 
水 平分 辨 率 是 通过 数 黑 白 竖 直线 来 进行 测量 的 。 这 些 竖 直 线 能 以 相当 于 光栅 高 度 的 距离 被 如 
新 产生 。 因 此 ， 一 个 水 平分 辩 率 为 300 线 的 系统 ， 就 能 够 产生 150 条 黑 线 和 150 条 白 线 。 黑 
相间 ， 横 穿 于 整个 图 像 高 度 的 水 平 距离 。 
黑白 线 的 扫描 模式 在 于 能 产生 高 频 电 子 信 号 ， 用 于 处 理 和 转换 这 些 信 号 的 电路 均 有 一 个 
适当 的 带宽 ， 广播 电视 系统 中 每 80 条 线 的 水 平分 辨 率 需要 1MHz 的 带宽 。 由 于 北美 广播 电视 
系统 利用 的 带宽 为 4.5MHz， 所 以 水 平分 辨 率 的 理论 极限 是 380 线 。 

4) 垂直 分 辨 率 

第 二 个 分 辩 率 参数 是 垂直 分 辩 率 (Vertical Resolution)。 它 简单 地 依赖 于 同一 帧 面 扫 描 线 的 
数量 。 扫描 线 越 多 ， 牌 直 分 辨 率 就 越 高 。 广播 电视 系统 利用 了 每 个 帧 面 525( 北 美 ) 或 825( 欧 洲 ) 
线 的 重 
线 的 寻 | | 从 

4. 视频 信号 的 时 间 特 性 
视频 信号 的 时 间 特 性 可 用 视频 帧 率 (Video Framerat oa 视 舌 帧 率 表 示 视 频 图 像 在 屏 营 


上 每 秒 显示 帧 的 数量 即 每 秒 帧 数 (frame per seconde ie 图 3. 15 给 出 了 视频 帧 率 与 图 像 动态 
连续 性 的 关系 。 
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图 3 115 视频 由 率 

由 该 图 可 看 出 : 上 率直 高， 图 像 的 运动 就 越 流畅 ， 大 于 每 秒 15 帧 便 可 产生 连续 的 运动 图 
像 。 在 电视 系统 中 ，PAL 制式 采用 25 帧 /s， 隔 行 扫描 的 方式 ;NTSC 制式 则 采用 30 帧 /s， 隔 
行 扫描 的 方式 。 较 低 的 帧 率 ( 低 于 10) 仍 然 呈 现 运动 感 ， 但 看 上 去 有 “其 自 ” 感 。 











3.5.2 ”彩色 电视 制式 


目前 世界 上 使 用 的 彩色 电视 制式 有 3 种 : NTSC 制 、PAL 制 和 SECAM 制 。 其 中 NTSC 
(National Television Systems Committee) 彩 色 电视 制式 是 1952 年 美 家 电视 标准 委员 会 定义 
的 彩色 电视 广播 标准 ， 称 为 正 交 平衡 调幅 制 。 美 国 、 加 拿 大 等 大 部 分 西半球 国家 ， 以 及 日 本 、 
韩国 、 菲 律 宾 等 国 和 中 国 台湾 地 区 采用 这 种 制式 。 
于 NTSC 制 存在 相位 敏感 造成 彩色 失真 的 缺点 ， 因 此 德国 (当时 的 联邦 德国 ) 于 1982 年 
制定 了 PAL(Phase-Alternative Line) 制 彩色 电视 广播 标准 ， 称 为 逐 行 倒 相 正 交 平 衡 调 幅 制 。 德 
、 英 国 等 一 些 西欧 国家 ， 以 及 中 国 、 朝 鲜 等 国家 采用 这 种 制式 。 
法 国 制定 了 SECAM 彩色 电视 广播 标准 ， 称 为 顺序 传送 彩色 与 存储 制 。 法 国 、 前 苏联 及 
东欧 国家 采用 这 种 制式 。 世 界 上 约 有 65 个 地 区 和 国家 使 用 这 种 制式 。 

NTSC 制 、PAL 制 和 SECAM 制 都 是 兼容 制 制式 。 这 里 说 的 “兼容 ”有 两 层 意思 : 一 层 
意思 是 指 黑白 电视 机 能 接收 彩色 电视 广播 ， 显 示 的 是 黑白 图 像 ， 另 一 层 意思 是 彩色 电视 机 能 
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下 多 媒体 找 坟 肥 其 应 用 第 之 服 ) 
接收 黑白 电视 广播 ， 显 示 的 也 是 黑白 图 像 ， 这 称 为 逆 兼 容 性 。 


























不 同 的 电视 制式 其 扫描 特性 各 不 相同 。 
1. PAL 制 电视 的 扫描 特性 


PAL 电视 制 的 主要 扫描 特性 如 下 。 

(1) 625 行 (扫描 线 )/ 帧 ，25 帧 /s(40 ms/ 帧 )。 

(2) 高 宽 比 (aspectratio) 为 4: 3。 

(3) 隔行 扫描 ，2 场 / 帧 ，312.5 行 / 场 。 

(4) 颜色 模型 为 YUV。 

一 帧 图 像 的 总 行 数 为 625 行 ， 分 两 场 扫描 。 行 扫描 频率 是 15 825Hz， 周 期 为 84hs; 场 扫 
描 频率 是 50Hz， 周 期 为 20ms; 帧 频 是 25Hz， 是 场 频 的 一 半 ， 周 期 为 40ms。 在 发 送 电视 信号 
时 ， 每 一 行 中 传送 图 像 的 时 间 是 52.2hs， 其 余 的 11.8hs 不 传送 图 像 ; 是 行 扫描 的 逆 程 时 间 ， 
同时 用 作 行 同步 及 消 隐 用 。 每 一 场 的 扫描 行 数 为 623/2 三 312.5 行 ， th 25 行 作 场 回 扫 ， 不 传 
送 图 像 ， 传 送 图 像 的 行 数 每 场 只 有 287.5 行 ， 因此 每 村 R 丰 G 全 有 图 像 显示 。 

2. NTSC 制 的 扫描 特性 3 + 

NTSC 彩色 电视 制式 的 主要 特性 如 下 。 SN 和 

(1) 525 行 / 帧 ，30 帧 /s(29.97 fps，33.37 msyfianie)。 

(2) 高 宽 比 : 电视 画面 的 长 宽 比 ( 1 视 为 43; 电影 为 3 : 2; 高 清晰 度 电 视 为 16 : 9)。 

(3) 隔行 扫描 ， 一 帧 分 成 2 场 (fieldjx2625 线 / 场 。 

(4) 在 每 场 的 开始 部 分 保留 20 扫描 作 为 控制 信息 ， EM 只 有 485 条 线 的 可 视 数据 。Laser 
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disc 约 420 线 ，S-VHS 约 320 线 忆 X XI 从 
(5) 每 行 63.5hs， 水 吾 回 扫 时 间 10hs( 包 合 ER 所 以 显示 时 间 是 53.5hs。 
(6) 颜色 模型 : YIQ。 


一 帧 图 像 的 总 行 煞 为 525 行 ， 分 两 所 i 15 750Hz， 周 期 为 63.5ks; 场 
扫描 频率 是 80Hz， 周期 为 16.67ms; 帧 频 是 30Hz， 周期 33.33ms。 每 一 场 的 扫描 行 数 为 525/2 
一 282.5 行 。 除了 两 场 的 场 回 扫 外 ， 实际 传送 图 像 的 行 数 为 480 行 。 

3. SECAM 

SECAM 制式 是 法 国 开 发 的 一 种 彩色 电视 广播 标准 , 称 为 顺序 传送 彩色 与 存储 制 。 这 种 制 
式 与 PAL 制 类 似 , 其 差别 是 SECAM 中 的 色 度 信号 是 频率 调制 (FM), 而 且 它 的 两 个 色差 信号 
红色 差 (R'-Y') 和 蓝 色差 (B'-Y") 信 号 是 按 行 的 顺序 传输 的 .图 像 格式 为 4 : 3, 625 线 ,50 Hz,6 MHz 
电视 信号 带宽 ， 总 带宽 为 8MHz。 


























3.6 ”视频 的 数字 化 
视频 信息 是 人 们 喜闻乐见 的 一 种 信息 表示 形式 ， 将 这 些 信 息 的 表现 形式 引入 计算 机 ， 就 
必须 将 其 数字 化 。 现 有 的 技术 已 使 PC 足以 具备 视频 信息 的 处 理 功 能 
3.6.1 ”视频 信息 的 获取 
视频 信息 的 获取 主要 可 分 为 两 种 方式 : 其 一 ， 通 过 数字 化 设备 ， 如 数码 摄像 机 、 数 码 照 


区 


| 
相机 、 数 字 光 盘 等 获得 ; 其 二 ， 通 过 模拟 视频 设备 ， 如 摄像 机 、 录 像 机 (VCR) 等 输出 的 模拟 信 
号 再 由 视频 采集 卡 将 其 转换 成 数字 视频 存 入 计算 机 ， 以 便 计 算 机 进行 编辑 、 播 放 等 各 种 操作 。 
在 第 二 种 方法 中 ,要 使 一 台 PC 具有 视频 信息 的 处 理 功能 ， 系 统 对 硬件 和 软件 的 需求 如 
恒 3.16 所 示 。 这 些 设备 是 视频 卡 、 视 频 存储 设备 、 视 频 输入 源 及 视频 软件 。 
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图 3.16 PC 上 录制 视频 的 系统 需求 


(1) 视频 (捕获 ) 卡 : 将 所 视频 信号 转 的 小 字 化 视频 信号 
(2) 视频 存储 设备 : 至 少 有 aq 由 硬盘 空间 或 


(3) 一 个 视频 输入 源 ， 如 交 病 撤 公 iT (播放 器 )， 这 些 设 备 连 到 视频 
捕获 板 上 。 
(4) 视频 软件 (如 we 包括 i 压缩 ， 播 放 和 基本 视频 编辑 功能 

在 PC 中 的 视频 卡 将 模拟 视频 信号 转换 为 数 党 号 ,并 记录 在 一 个 硬盘 文件 中 。 文件 格式 
依赖 于 录制 视 硬件 和 软件 。 一 般 说 来 , :录制 后 的 视频 质量 不 会 比 原先 的 图 像 质量 更 高 。 
在 MPC 环境 中 ,捕获 视频 质量 的 好 坏 是 衡量 其 性 能 的 一 个 重要 指标 。 原 则 上 讲 ， 在 MPC 中 
视频 质量 主要 依赖 于 3 个 因素 : 视频 窗口 大 小 、 视 频 帧 率 及 色彩 的 表示 能 力 。 

(1) 视频 窗口 的 大 小 是 以 像素 来 表示 的 (组 成 图 像 的 一 个 点 称 为 一 个 像素 )， 如 320X240 
或 180X120 像素 。VGA 标准 屏幕 上 640X480 像素 ， 这 意味 着 一 个 320X 240 的 视频 播放 窗 
占据 了 VGA 屏幕 的 1/4。 目前 , 个 人 计算 机 显示 器 的 分 辩 率 常用 的 还 有 800X600、1 024 X768 
等 。 系 统 能 够 提供 的 视频 播放 窗口 越 大 ， 对 软 、 硬 件 的 要 求 就 越 高 。 

(2) 视频 帧 率 表示 视频 图 像 在 屏幕 上 每 秒 钟 显示 帧 的 数量 。 一 般 把 屏幕 上 一 幅 图 像 称 为 
顺 。 视 频 帧 率 的 范围 可 从 0( 静 止 图 像 ) 一 30 帧 /s。 帧 率 越 高 ， 图 像 的 运动 就 越 流畅 ， 最 高 的 
率 为 30 帧 /s。 
(3) 色彩 表示 能 力 依赖 于 色彩 深度 (Color Depth) 和 色彩 空间 分 辨 率 。 色 彩 深度 指 允 许 不 
色彩 的 数量 。 色 彩 越 多 ， 图 像 的 质量 越 高 ， 并 且 表 示 的 真实 感 就 越 强 。PC 上 的 色彩 深度 范 
从 VGA 调 色 板 的 4 位 、16 色 到 24 位 真 彩色 1 670 万 种 色彩 ， 要 用 于 视频 至 少 需 要 一 个 256 
色 的 VGA 卡 或 更 高 。 色 彩 空间 分 辩 率 指 色 彩 的 空间 “粒度 ”或 “ 块 状 ”。 即 每 个 像素 是 否 都 
能 赋予 它 自身 的 颜色 。 当 每 个 像素 都 能 赋予 它 自身 颜色 时 ， 质 量 最 高 。 

视频 卡 是 多 媒体 计算 机 中 处 理 视频 信号 获取 与 播放 的 插件 ， 主 要 功能 如 下 。 

(1) 从 多 种 视频 源 中 选择 一 种 输入 。 
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一 多 若 你 乒 林 及 站 应 用 (第 二 县 ) 


一 (2) 支持 不 同 的 电视 制式 (如 NTSC、PAL 等 )。 





(3) 同时 处 理 电视 画面 的 伴音 。 

(4) 可 在 显示 器 上 监 看 输入 的 视频 信号 、 位 置 及 大 小 可 调 。 

(5) 可 将 VGA 画面 内 容 (graphics、text、image) 与 视频 登 加 处 理 。 

(6) 可 随时 冻结 (定格 ) 一 幅 画 面 ， 并 按 指 定格 式 保存 。 

(7) 可 连续 地 (实时 地 ) 压 缩 与 存储 视频 及 其 伴音 信息 ， 编 码 格式 可 选 。 

(8) 可 连续 地 (实时 地 ) 解 压缩 并 播放 视频 及 其 伴音 信息 ， 输 出 设备 可 选 (VGA 监视 器 、 电 
视 机 、 录 像 机 等 )。 


3.6.2 ”视频 信息 的 数字 化 


通常 ， 摄 像 机 、 录 像 机 所 提供 的 视频 信息 是 模拟 量 ， 要 使 计算 机 能 接受 并 处 理 ， 需 将 其 
数字 化 ， 即 将 原先 的 模拟 视频 变 为 数字 化 视频 。 视 频 图 像 数字 化 通常 有 两 种 方法 。 一 种 是 复 
合 编码 ， 它 直接 对 复合 视频 信号 进行 采样 、 编 码 和 传输 ; Sh 编码 ， 它 先 从 复合 彩 


















































色 视频 信号 中 分 离 出 彩色 分 量 (Y， 亮度 ，U、V， 色 度 )， 然 后 数字 化 。 我 们 现在 接触 到 的 大 
多 数 数字 视频 信号 源 都 是 复合 的 彩色 全 视频 信号 ， pa] 激光 视盘 、 摄 像 机 等 。 对 这 类 
信号 的 数字 化 ， 通 常 是 先 分 离 成 Y、U、V 或 RGB 分 量 信 号 ， 分 别 进行 滤波 ， 然 后 用 3 
个 A/D 转换 器 对 它们 数字 化 ， 并 加 以 编码 。 图 3:177 是 分 量 编码 系统 的 基本 框图 。 目 前 ， 这 种 
方案 已 成 为 视频 信号 数字 化 的 主流 。 自 20 世纪 90 年 代 以 来 颁布 的 一 系列 图 像 压缩 国际 标准 
均 采 用 分 量 编码 方案 。 SS 

















3.17 ”分量 编码 系统 的 基本 框图 


3.6.3 ”视频 信号 的 采样 格式 


采样 是 视频 信号 数字 化 的 重要 内 容 。 对 彩色 电视 图 像 进 行 采样 时 ， 可 以 采用 两 种 采样 方 
法 。 一 种 是 使 用 相同 的 采样 频率 对 图 像 的 亮度 信号 和 色差 信号 进行 采样 ， 另 一 种 是 对 亮度 信 
号 和 色差 信号 分 别 采 用 不 同 的 采样 频率 进行 采样 。 如 果 对 色差 信号 使 用 的 采样 频率 比 对 亮度 
信号 使 用 的 采样 频率 低 ， 这 种 采样 就 称 为 图 像 子 采样 。 
像 子 采样 在 数字 图 像 压 缩 技 术 中 得 到 广泛 的 应 用 。 可 以 说 ， 在 彩色 图 像 压 缩 技术 中 ， 
最 简便 的 图 像 压缩 技术 是 图 像 子 采样 。 这 种 压缩 方法 的 基本 根据 是 人 的 视觉 系统 所 具有 的 两 
条 特性 。 一 是 人 眼 对 色 度 信号 的 敏感 程度 比 对 亮度 信号 的 敏感 程度 低 ， 利 用 这 个 特性 可 以 把 
图 像 中 表达 颜色 的 信号 去 掉 一 些 而 使 人 不 察觉 ， 二 是 人 眼 对 图 像 细 节 的 分 辩 能 力 有 一 定 的 限 
度 ， 利 用 这 个 特性 可 以 把 图 像 中 的 高 频 信 号 去 掉 而 使 人 不 易 察 觉 。 子 采样 也 就 是 利用 人 的 视 
觉 系 统 将 这 两 个 特性 达到 压缩 彩色 电视 信号 而 尽量 不 失真 的 目的 。 

试验 表明 ， 使 用 下 面 介绍 的 子 采 样 格式 ， 人 的 视觉 系统 对 采样 前 后 显示 的 图 像 质量 没有 
感到 有 明显 差别 。 目 前 使 用 的 子 采样 格式 有 如 下 几 种 。 
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第 3 章 
天 字画 短视 映 克 还 拉 坟 | 


(1) 4 : 4 : 4: 这 种 采样 格式 不 是 子 采样 格式 ， 它 是 指 在 每 条 扫描 线 上 每 4 个 连续 的 采样 
点 取 4 个 亮度 Y 样本 、4 个 红色 差 Ci 样本 和 4 个 蓝 色差 Cb 样本 ， 这 就 相当 于 每 个 像素 用 3 
个 样本 表示 。 

(2) 4 : 2 : 2: 这 种 子 采 样 格 式 是 指 在 每 条 扫描 线 上 每 4 个 连续 的 采样 点 取 4 个 亮度 Y 样 
本 、2 个 红色 差 Cr 样本 和 2 个 蓝 色 差 Cb 样本 ,平均 每 个 像素 用 2 个 样本 表示 。 

(3) 4 ; 1 : 1: 这 种 子 采样 格式 是 指 在 每 条 扫描 线 上 每 4 个 连续 的 采样 点 取 4 个 亮度 Y 样 
本 、1 个 红色 差 Cr 样本 和 1 个 蓝 色 差 Co 样本， 平均 每 个 像素 用 1.5 个 样本 表示 。 

(4) 4 : 2 : 0: 这 种 子 采 样 格式 是 指 在 水 平和 垂直 方向 上 每 2 个 连续 的 采样 点 上 取 2 个 亮 
度 Y 样 本 、1 个 红色 差 Cr 样本 和 !1 个 蓝 色差 Ce 样本 ， 平 均 每 个 像素 用 1.5 个 样本 表示 。 

图 3.18 用 图 解 的 方法 对 以 上 4 种 子 采 样 格式 做 了 说 明 。 









































图 3.18 彩色 图 像 YCbCi 样 本 空间 位 置 
1. 4 :4 :4YCsCe 阁 式 
图 3.19 说 明 625 扫描 行 系统 中 采样 格式 为 4 : 4 : 4 的 YCbC: 的 样本 位 置 。 对 每 个 采样 点 











Y、Cb 和 Ci 各 取 一 个 样本 。 对 于 消费 类 和 计算 机 应 用 ， 每 个 分 量 的 每 个 样本 精度 为 8bit， 对 于 
编辑 类 应 用 ,每 个 分 量 的 每 个 样本 的 精度 为 10bit。 因 此 , 每 个 像素 的 样本 需要 24bit 或 者 30bit。 
扫描 线 
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314 -@®@—©®—© © ©—©- 
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3 -©® © © © ©—©- 
图 YY,C,,C 样 本 














图 3.19 4 :4:4 子 采样 格式 
2. 4 :2 :2YCbCr 格 式 


图 3.20 说 明 625 扫描 行 系统 中 采样 格式 为 4 : 2 : 2 的 YCbC:r 的 样本 位 置 。 在 水 平 扫 描 方 
向 上 , 每 2 个 Y 样 本 有 1 个 Ce 样本 和 一 个 Cr 样本 。 对 于 消费 类 和 计算 机 应 用 ， 以 及 编辑 类 
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加 居 


多 媒体 披 术 及 其 应 用 (第 之 厄 ) 











一 应 用 ， 每 个 分 量 的 每 个 样本 精度 同 4 : 4 : 4 YCbCi 格式 的 每 个 分 量 的 每 个 样本 精度 。 在 帧 绥 

















存 中 ， 每 个 样本 需要 16bit 或 者 20bit。 显 示 像素 时 ， 对 于 没有 Cr 和 Ce 的 Y 样本 ,使 用 前 后 
相 邻 的 C+ 和 Cs 样本 进行 计算 得 到 的 C+: 和 Cb 样本 。 

6 站 式 

图 3.21 说 明 625 扫描 行 系统 中 采样 格式 为 4 : 1 : 1 的 YCbC: 的 样本 位 置 。 这 是 数字 电视 
盒 式 磁带 (digital video cassette，DVC) 上 使 用 的 格式 。 在 水 平 扫描 方向 上 ,每 4 个 Y 样本 各 有 
1 个 Ce 样本 和 一 个 Cr 样本 ， 每 个 分 量 的 每 个 样本 精度 为 8bit。 因 此 ， 在 帧 缓存 中 ， 每 个 样本 
需要 12bit。 显 示 像 素 时 ， 对 于 没有 Cr 和 Cs 的 Y 样本 ， 使 用 前 后 相 邻 的 Ctr 和 Cs 样本 进行 计 
算得 到 该 Y 样本 的 Cr 和 Cb 样本 。 

















1 描 线 | 描 线 
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图 YC,C 样 个”@ Y 样 本 ge 图 Y, CC 样本。 @ Y 样 本 


图 3.20 4 : 2 :2 子 采 样 格式 、 图 3.21 4:1:1 子 采样 格式 


4. 4 :2 :0YCbCr 格 式 3 


1) H.261, H.263 和 MPEG-1 

图 3.22 说 明 625 扫描 行 系统 中 采样 格式 为 42 : 0 的 YCoC: 的 样本 位 置 。 这 是 H.261， 
H.263 和 MPEG1 使 用 的 子 采 样 格 式 。 在 水 平方 向 的 2 个 样本 和 垂直 方向 上 的 2 个 Y 样本 共 
4 个 样本 有 1 个 Ge 样本 和 一 个 Cr 样本 。 如 果 每 个 分 量 的 每 个 样本 精度 为 8bit， 在 帧 缓存 中 每 
个 样本 就 需要 12bit。 

2) MPEG-2 

虽然 MPEG-2 和 MPEG-1 使 用 的 子 采 样 都 是 4 : 2 : 0， 但 它们 的 含义 有 所 不 同 。 图 3.23 
说 明 采 样 格式 为 4 : 2 : 0 的 YCbCr 空间 样本 位 置 。 与 MPEG-1 的 4 : 2 : 0 相 比 ，MPEG-2 的 
子 采样 在 水 平方 向 上 没有 半 个 像素 的 偏 移 。 

二 | 描 线 


10314 一 和 全 一 全 一 全 一 一 全 一 一 全 一 


© © 


21315 一 和 和 一人 人 一 人 一 全 一 








31316 一 和 9 一 9 一 一 人 一 人 一 一 人 一 


© © 


1317 一 和 人 0 人 人 一 


3318 一 04 人 一 





图 计算 所 得 的 Cs, C 样 本 图 计算 所 得 的 Cu C 样 本 
@ Y 样 本 @ Y 样 本 
图 3.22 MPEG-1 使 用 的 4 : 2 : 0 子 采样 格式 图 3.23 MPEG-2 的 空间 样本 位 置 
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这 | 人 


3.7 ”数字 视频 标准 














为 了 能 方便 地 在 不 同 的 应 用 和 产品 中 间 交 换 数字 视频 信息 ， 就 需要 将 数字 视频 标准 化 。 
视频 数据 是 按照 压缩 的 形式 来 交换 的 ， 这 就 导致 了 压缩 标准 的 出 现 。 在 计算 机 行业 中 ， 有 显 
示 分 辨 率 的 标准 ， 在 TV 行业 中 ， 有 数字 化 演播 室 标准 ， 而 在 通信 行业 中 已 经 建立 了 标准 的 
通信 协议 。 数 字 视 频 通信 的 出 现 使 得 上 述 3 个 行业 联系 更 加 紧密 。 近 年 来 ， 横 贯 所 有 行业 的 
标准 化 进程 已 经 开始 。 

早 在 20 世 纪 80 年 代 初 ,国际 无 线 电 咨询 委员 会 (International Radio Consultative Committee， 
CCIR) 就 制定 了 彩色 电视 图 像 数 字 化 标准 ， 称 为 CCIR 801 标准 ， 现 改 为 ITU-R BT.801 标准 。 
该 标准 规定 了 彩色 电视 图 像 转换 成 数字 图 像 时 使 用 的 采样 频率 ，RGB 和 YCbCr 或 者 写成 
































YCaCr) 两 个 彩色 空间 之 间 的 转换 关系 等 。 XN 
1， 彩 色 空间 之 间 的 转换 LNXN 




















在 数字 域 而 不 是 模拟 域 中 RGB 和 YuC 两 个 形 色 室 向 之 问 的 转换 关系 日 下 式 表 示 ， 
Y=0.299R+0.587G 二 0.1I4B，、 
Cr=(0.500R 一 0.418 7G 一 00813B) 十 128 
Co 一 (一 0.168 TR—0.331 3G-+0.500B)+ 128 
2， 采 样 频率 ST 
CCIR 为 NTSC 制 、PAL 制 和 SECAM 制 规定 了 共同 
也 用 于 远程 图 像 通信 网 络 中 的 电视 图 像 信 号 采样 。 x 
对 PAL 制 、SECAM 制 ， 采样 频率 为 、” 从 
7 f=625 X25XN=15 825X N13.5(MHz), N=864 
其 中 ，N 为 每 二 扫描 行 目的 采样 数目 。 < 
对 NTSC 制 \ 梁 样 频率 人 为 | 
~ f=525X29.97XN=15 734XN=13.5(MHz), N=858 
其 中 ，N 为 每 一 扫描 行 上 的 采样 数目 。 
采样 频率 和 同步 信号 之 间 的 关系 如 图 3.24 所 示 。 


天 天 






的 记 视 图 像 采 样 频率 。 这 个 采样 频率 














采样 频 闪 


NTSC 制 PAL 制 


图 3.24 采样 频率 


79 


本 多 媒体 技术 及 其 应 用 (第 2 版 ) 
5 3. 有 效 显 示 分 状 率 


对 PAL 制 和 SECAM 制 的 亮度 信号 ， 每 一 条 扫描 行 采样 864 个 样本 ; 对 NTSC 制 的 亮度 
信号 ， 每 一 条 扫描 行 采样 858 个 样本 。 对 所 有 的 制式 ,每 一 扫描 行 的 有 效 样本 数 均 为 720 个 。 
每 一 扫描 行 的 采样 结构 如 图 3.25 所 示 。 

4. ITU-R BT.601 标准 摘要 


ITU-R BT.601 用 于 对 隔行 扫描 电视 图 像 进行 数字 化 , 对 NTSC 和 PAL 制 彩色 电视 的 采样 
频率 和 有 效 显示 分 辩 率 都 做 了 规定 。 表 3-3 给 出 了 ITU-R BT.601 推荐 的 采样 格式 、 编 码 参数 
和 采样 频率 。 

















122 像 素 。 720 像 素 | 1 16 像 娄 





NTSC 制 | + A 











132 像 素 ” 720 像素 X 
+ wi | 


PAL 制 
SECAM 制 








图 3. 25、 TUR BT.801 的 亮度 采样 结 


-了 表 3-3， 六 电视 数 数字 化 参数 摘 要 ~ 


采样 频率 (MHz “村 本 娄 


范围 
858(720 220 级 (16~235) 
429(360 225 级 (16 一 240) 
360 | (128+112) 


858(720 225 级 (16 一 240) 
858(720) 864(720) (128 土 112) 


ITU-R BT.601 推荐 使 用 4 : 2 : 2 的 彩色 电视 图 像 采样 格式 。 使 用 这 种 采样 格式 时 ，Y 





全 | 858(720 220 级 (16--235) 





















































13.5 MHz 的 采样 频率 ，Cr、Cbe 用 8.75MHz 的 采样 频率 。 采 样 时 ,采样 频率 信号 要 与 场 同步 和 
行 同步 信号 同步 。 
5. CIF、QCIF 和 SQCIF 
为 了 既 可 用 625 行 的 电视 图 像 又 可 用 525 行 的 电视 图 像 ，CCITT 规定 了 称 为 公用 中 分 辨 
率 格式 (Common Intermediate Format，CIF)，1/4 公用 中 分 辩 率 格式 (Quarter-CIF，QCIF) 和 
(Sub-Quarter Common Intermediate Format，SQCIF) 格 式 ， 具 体 规格 见 表 3-4。 
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5 和 时 


表 3-4 CIF、QCIF 和 SQCIF 图 像 格式 参数 








SQCIF 
行 数 ( 帧 ) | 。 像素 ( 行 ) 





行 数 ( 帧 ) 
亮度 (Y) 288 
色 度 (Cb) 144 
色 度 (CD 144 


CIF 格式 具有 如 下 特性 。 

(1) 电视 图 像 的 空间 分 辨 率 为 家 用 录像 系统 (Video Home System，VHS) 的 分 辩 率 ， 即 
352X288。 

(2) 使 用 非 隔行 扫描 。 

G) 使 用 NTSC 帧 速率 ， 电 视图 像 的 最 大 帧 速率 为 30 000/1 oil 97 幅 /s。 

(4) 使 用 1/2 的 PAL 水 平分 辨 率 ， 即 288 线 。 

(5) 对 亮度 和 两 个 色差 信号 (Y、Cb 和 CD 分 量 分 别 进行 和 它们 的 取 值 范围 同 ITU-R 
BT.801。 即 黑色 三 18， 白 色 ==235， 大 人 20 ， 最 小 值 等 于 18。 


像素 ( 行 ) 
380(352) 
180(176) 
180(176) 


行 数 ( 帧 ) 
144 
72 
72 


像素 ( 行 ) 
180(176) 
90(88) 
90(88) 






















































































3. 8 视频 信 总 的 压缩 编码 


数字 化 后 的 视频 信号 将 产 AN 例如 , 一 幅 具 有 中 等 分 辩 率 (840X480) 的 彩色 (24 
位 /像素 ) 数 字 视频 图 像 攻 数据 量 约 占 将 近 1MB 的 存储 空间 100MB 的 硬盘 空间 也 只 能 存储 约 
100 帧 静止 图 像 画 面 。 如 果 以 25 帧 /s 的 帧 率 显 2 示 运动 图 像 ， 100MB 的 硬盘 空间 所 存储 的 图 像 
信息 也 只 能 显示 约 4 过 此 可 见 ， 高 效 实时 地 压缩 视频 信号 的 数据 量 是 是 多 媒体 计算 机 系统 不 
可 回 避 的 关键 性 技术 问题， 否则 难以 推广 使 用 























从 20 世纪 80 年 代 开 始 ， 世 界 上 许多 大 的 集团 和 公司 就 积极 从 事 视频 、 音 频数 据 压 缩 技 
术 的 研究 ， 并 推出 了 许多 商品 化 的 产品 ， 如 荷兰 Philips 公司 等 推出 的 CD-I 紧凑 盘 交 互 系统 
采用 一 个 5 英寸 840MB 只 读 光盘 (CD-ROM)， 将 声 、 文 、 图 、 动 画 、 静 止 画面 和 全 运动 屏幕 
等 大 量 信息 以 压缩 形式 存储 在 光盘 上 ， 其 压缩 比 约 为 10 : 1， 由 Intel 和 IBM 公司 推出 的 DVI 
多 媒体 系统 产品 在 CD-ROM 只 读 光盘 基础 上 开发 了 一 套 全 屏幕 、 全 运动 视频 系统 。DVI 的 视 
频 压缩 技术 是 由 Intel 公司 独家 生产 的 1750 专用 芯片 组 完成 的 , 这 套 芯 片 组 的 特点 是 利用 微 程 
序 控制 ， 通 过 载 入 微 代码 ， 可 以 执行 多 种 图 像 压缩 算法 和 图 像 像素 处 理 及 视频 显示 等 特殊 功 
能 。 目 前 该 芯片 组 的 压缩 比 可 达 100 : 1 至 180 : 1 的 水 平 ， 随 着 芯片 版 本 不 断 更 新 ， 将 可 提 
供 更 好 的 压缩 算法 ， 从 而 提高 图 像 的 画面 质量 。 

数据 压缩 之 所 以 可 以 实现 是 因为 原始 的 视频 图 像 信 息 存在 很 大 的 元 余 度 。 例 如 ， 当 移动 
视频 从 一 帧 移 到 另 一 帧 时 ， 大 量 保留 的 信息 是 相同 的 ， 压 缩 (或 硬件 ) 检 查 每 一 帧 , 经 判别 后 仅 
存储 从 一 帧 到 另 一 帧 变化 的 部 分 。 例 如 ， 由 运动 引起 的 改变 。 此 外 ， 在 同一 帧 里 面 某 一 区 域 
可 能 由 一 组 相同 颜色 的 像素 组 成 ， 压 缩 算 法 可 将 这 一 区 域 的 颜色 信息 作为 一 个 整体 对 待 ， 而 
不 是 分 别 存 储 每 个 像素 的 颜色 信息 。 这 些 元 余 ， 归 结 起 来 可 有 3 种 能 够 易于 识别 的 类 型。 
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意 .... 


> 


(1) 空间 元 余 : 
(2) 频谱 元 余 : 
(3) 暂 存 匈 余 : 


感 (视觉 掩盖 效应 ) 和 
现 高 














压缩 方案 可 以 针 
人 是 主要 接收 者 ， 眼 睛 是 图 像 信 息 的 接收 端 ， 就 有 可 能 利用 人 的 视觉 对 于 边缘 急剧 


压缩 比 ， 而 使 得 
像 压缩 的 目的 在 于 移 走 元 余 信息 ， 减 少 表示 一 个 图 像 所 需 的 


下 多 媒体 找 坟 及 黄 应 用 (第 之 服 ) 


由 相 邻 像素 值 之 间 的 关系 所 致 。 

由 不 同 颜色 级 别 或 频谱 带 的 关系 所 致 。 

由 一 个 图 像 序列 中 不 同 帧 之 间 的 关系 所 致 。 
对 任 一 种 类 型 或 所 有 类 型 进行 压缩 。 另 外 ， 由 








民 晴 对 图 像 的 亮度 信息 敏感 , 对 颜色 分 辩 力 弱 的 


压缩 数据 恢复 的 图 像 信 号 仍 有 满意 的 主观 质 


























图 像 压缩 ， 但 它们 可 
在 无 损 压 缩 中 ， 





在 有 损 
3.8.2 


压缩 中 ， 
一 般 地 ， 





[基本 分 为 两 种 类 型 ; 无 损 压缩 和 有 损 压 缩 。 
压缩 后 重 构 的 图 像 在 像素 级 是 等 同 的 ， 因 而 压缩 前 后 显示 的 效果 是 一 样 
的 ， 显 然 ， 无 损 压 缩 是 理想 的 。 




















然而 ， 仅 可 能 压缩 少量 的 信息 。 
重 构 的 图 像 和 原先 图 像 相 比 退化 了 ， 








A 




















1. JPEG 


“联合 图 像 专家 组 ”(the Joint Phot 


于 1991 年 3 
内 容 如 下 。 








而 重建 图 像 
量化 及 哈 夫 曼 型 的 


编码 





Je 
eh 


ek 











于 在 多 媒体 应 











号 
星 。 





领域 中 ， 
变化 不 敏 
特点 及 听觉 的 生理 特性 实 








存储 量 。 有 许多 方法 


结果 能 获得 比 原 无 损 压缩 更 高 
压缩 率 越 高 ， 重 构 后 的 图 像 退 化 越 严重 。 Rs 


常用 的 图 像 压缩 方案 , 
面 殉 由 儿 和 和 较 有 时 的 因 全 缠 方 宁 、、 


于 














的 压 


perts Group，JPEG) 经 过 5 年 的 细致 工作 后 ， 
月 提出 了 ISO pe 尺 草案 : | ， 主 要 


(1) 基本 系统 (Baseline Se 提 代 本 妆 朱 和 建交 从， 实现 信息 有 丢失 的 图 像 压缩 ， 
nh 

炳 编码 器 。 

(2) 扩 a ysiem) 过 用 加 4 法 ， 编 码 过 程 采用 具有 自 适应 能 力 的 算术 


它 采 用 8X8 像素 自 适 应 DCT 算法 、 


@) 无 失真 的 预测 编码 ， 采 用 帧 内 预测 编码 及 哈 夫 曼 编码 (或 算术 编码 )， 可 保证 重建 图 像 


数据 与 
JPEG 能 以 20 : 
是 可 





能 的 ， 但 压缩 率 越 高 ， 图 像 损失 越 大 。 
JPEG 的 另 一 个 优点 是 , 它 





3 原始 图 像 数 据 完全 相同 ( 即 均 方 误差 等 于 零 )。 


1 的 压缩 比 压缩 图 像 ， 且 不 明显 损失 图 像 质 














量 。 压 缩 高 达 100 : 


是 一 个 对 称 算法 ,同样 的 硬件 和 软件 能 被 




















1 压缩 也 


于 压缩 和 解压 缩 一 


个 图 像 。 此 外 ， 压 缩 与 解压 缩 的 时 间 是 相同 的 。 这 对 大 多 数 视频 压缩 方案 来 说 是 做 不 到 的 。 
JPEG 事实 上 已 成 为 压缩 静止 图 像 的 公认 的 国际 标准 。 














2.， 电视 电话 /会 议 电 视 PX 64Kb/s 标准 


CCITT 第 15 研究 组 积极 进 


基 群 传输 电 





议会 议 ” 





字 长 编码 及 梅花 型 亚 抽样 /内 插 复 原 ” 等 技术 。 该 研究 组 又 在 1988 年 提出 电视 





行 视频 编码 和 解码 器 的 标准 化 工作 ， 








于 1984 年 提出 了 “数字 
的 H.120 建议 。 其中， 图 像 压缩 采用 “ 帧 间 条 件 修 补 法 ”的 预测 编码 “ 变 


电话 /会 议 电 视 


H.28 建议 PX 64Kb/s， 即 (CCITTH.28) 标 准 , P 是 一 个 可 变 参数 , 取 值 为 1~~30, P=1 或 2 时 ， 














支持 1/4 通 
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中 间 格 式 每 秒 帧 数 较 低 的 视频 电话 ; 当 P>8 时 可 支持 通 
高 的 电视 会 议 。PX84Kb/s 视频 编码 压缩 算法 采用 的 是 混合 编码 方案 ， 在 低速 时 











中 








司 格式 每 秒 帧 数 较 
(P=1 或 2， 


即 


帧 ， 


义 
视 





天 字画 短视 映 克 还 才 坟 | 





64 或 128Kb/s) 除 采用 QCIF 外 ， 还 可 采用 亚 帧 (Sub-frame) 技 术 ， 即 隔 1( 或 2、3) 帧 处 理 1 
压缩 比 可 达 48 : 1。 
3. 运动 图 像 专家 组 MPEG-1 标准 
JPEG 发 起 者 一 一 国际 电报 电话 咨询 委员 会 和 国际 标准 化 组 织 已 专门 为 处 理 运动 视频 定 
了 一 个 压缩 标准 , 称 为 MPEG。 ISO CD11172 号 建议 于 1992 年 通过 。 它 包 括 3 部 分 : MPEG 
频 、MPEG 音频 和 MPEG 系统 。 由 于 视频 和 音频 需要 同步 ， 所 以 MPEG 压缩 算法 对 视频 和 



































音频 联合 考虑 ， 最 后 产生 一 个 具有 电视 质量 的 视频 和 音频 压缩 形式 的 MPEG 单一 位 流 ， 其 位 


压 


个 


率 约 为 15Mb/s。 
MPEG 视频 压缩 算法 采用 两 个 基本 技术 : 运动 补偿 即 预测 编码 和 插 补 编码 ; 变换 域 (DCT) 
缩 技术 。 在 MPEG 中 ， 如 果 一 个 视频 剪辑 的 背景 在 帧 与 帧 之 间 是 相同 的 ，MPEG 将 存储 这 
背景 一 次 ， 然 后 仅 存储 这 些 帧 之 间 的 不 同 部 分 。MPEG 平均 压缩 比 为 50 : 
此 外 ，MPEG 的 内 部 编码 能 力 在 其 压缩 算法 的 对 称 性 方面 不 同 于 WPEG， a 














MPEG 压缩 全 运动 视频 比 解压 缩 需要 利用 更 多 的 硬件 和 时 间作、 


最 
字 


A 





以 MPEG-1 作为 视 音 频 压 缩 标准 的 VCD 在 我 国 | 经 并 成 了 庞大 的 市 场 


A I\ 


4. 运动 图 像 专家 组 MPEG-2 及 其 他 标准 SS 一 


MPEG-2 主要 针 对 数字 电视 (DTV) 的 应 用 要 求 ， 率 为 1.2 一 1.3Mb/s 甚至 更 高 。MPEG-2 
显著 的 特点 是 通用 性 ， 它 保持 了 MPEG-T 向 下 兼容 ， 以 MPEG-2 作为 视 音频 压缩 标准 的 数 
卫星 电视 接收 机 IRD 已 经 形成 了 很 天 省 场 。 1993 年 下 半年 ， 美国 高 级 电视 联盟 (ATV Grand 
liance) 和 欧洲 数字 视频 广 播 计 CDigidal Video Broadcast Project) 先 后 决定 将 MPEG-2 用 于 ? 
本 放电 入 (DT - 播 中 ， 新 守信 的 数字 视盘 DVD 也 采用 MPEG-2 作为 其 视频 压缩 标准 。 

此 外 , 常 的 还 有 MPEG-4 和 H.261。MPEG-4 支 支持 在 各 种 网 络 条 件 下 交互 式 的 多 媒体 应 
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，H.261 是 国 ES 这 联盟 的 前 身 CCITT 制定 的 数字 视频 编码 标准 ， 它 适用 于 ISDN 网 上 以 P 
64Kb/s(P=1, XS” ,>30) 的 速率 开 展 视频 靖 议 和 可 视 电话 业务 ， 目前 仍 在 广泛 使 用 。 




















3.9 Windows 中 的 视频 编辑 软件 


Windows Movie Maker 是 Windows 系统 自 带 的 视频 制作 工具 ， 简 单 易学 ， 可 以 在 个 人 计 
机 上 创建 、 编 辑 和 分 享 自己 制作 的 家 庭 电影 。 通 过 简单 的 拖 放 操作 ， 精 心 的 筛选 画面 ， 然 
添加 一 些 效果 、 音 乐 和 旁白 ， 家 庭 电 影 就 初 具 规模 了 。 之 后 就 可 以 通过 Web、 电 子 邮件 、 








个 人 计算 机 或 CD， 甚 至 DVD， 与 亲朋 好 友 分 享 制作 成 果 了 。 同 时 ， 还 可 以 将 电影 保存 到 录 





带 上 ， 在 电视 机 或 者 摄像 机 上 播放 。 


3.9.1 Windows Movie Maker 的 运行 


行 


要 


Windows Movie Maker 的 运行 步骤 如 下 。 

选择 “开始 ”一 “所 有 程序 ”一 “Windows Movie Maker” 选 项 即 可 运行 该 软件 ， 软 件 运 
后 ， 显 示 如 图 3.26 所 示 的 运行 界面 。 

Windows Movie Maker 的 运行 界面 包含 3 个 主要 区 域 : 菜单 栏 和 工具 栏 、 窗 格 及 情节 提 
/时 间 线 。 
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ao 下 多 巡 休 技 术 有 其 应 用 (第 版) 
菜单 栏 r pt ye 
工具 栏 ) 9 











情节 提要 /时 | 





图 3.26 Windows Movie Ma 

其 中 , 菜单 栏 和 工具 栏 ,提供 了 有 关 在 Win 
执行 任务 的 信息 。 we 
Windows Movie Maker 用 户 界面 的 主要 动量 示 在 不 同 的 窗 格 中 ， 有 “电影 任务 ” 
“收藏 ” 窗 格 、“ 内 容 ” 窗 格 和 “视频 展示 \ 窗 客 。 根据 单 击 工具 栏 中 的 “任务 ”按钮 、“ 
按钮 的 不 同 ， 在 最 左边 窗 格 的 位 置 会 显示 “电影 任务 ” 窗 格 (如 图 3.26 所 示 ) 或 “收藏 ” 
“电影 任务 ” 窗 格 列 出 了 制作 电影 时 可 能 需要 执行 常见 任务 。 “收藏 ” 窗 格 显示 收藏 ， 


A 
M 








收藏 中 包括 剪辑 。 收藏 接客 称 列 在 左边 的 “收藏 窗 格 中 ， 而 选 定 收藏 中 的 剪辑 便 显示 在 中 





间 的 “内 容 ” 窗 格 中 :区 视 频 展示 ” 窗 格 可 以 播放 控制 浏览 单个 剪辑 或 整个 项 目 。 


间 线 


ey ovie Maker 中 使 用 菜单 命令 和 工具 栏 


窗 格 、 
收藏 ” 
窗 格 。 





情节 提要 和 时 间 线 是 用 于 制作 和 编辑 项 县 的 区 域 。 有 两 个 视图 : 情节 提要 视图 和 时 间 线 





视图 。 制 作 电影 时 可 以 在 这 两 个 视图 间 切 换 。 
3.9.2 ”获得 要 编辑 的 视频 




















户 可 以 使 用 Windows Movie Maker 将 视频 和 音频 捕获 到 计算 机 上 。 在 进行 捕获 之 前 ， 

















计算 机 必须 正确 连接 视频 捕获 设备 ， 并 且 Windows Movie Maker 可 以 检测 到 该 设备 。 























像 机 、 电 视 调谐 卡 或 麦克 风 等 。 可 以 捕获 实况 内 容 或 从 视频 磁带 上 捕获 内 容 。 





户 可 


以 使 用 的 音频 和 视频 捕获 设备 及 捕获 源 包括 数字 视频 (DV) 摄 像 机 、 模 拟 摄像 机 、VCR、Web 摄 

















正确 进行 。 


在 Windows Movie Maker 中 捕获 视频 和 音频 时 ,“ 视 频 捕 获 向 导 ” 将 指导 用 户 按 特定 步 又 


在 Windows Movie Maker 中 也 可 导入 计算 机 或 存储 介质 上 的 现 有 音频 、 视 频数 字 媒 体 文 


件 。 操 作 步 骤 如 下 。 
(1) 选择 “文件 ”菜单 中 的 “导入 到 收藏 ”选项 ， 打 开 “ 导 入 文件 ”对 话 框 。 
(2) 在 “文件 名 ”文本 框 中 输入 要 导入 的 文件 的 文件 名 ， 在 “查找 范围 ”下 拉 列 表 








要 导入 文件 的 路 径 ， 然 后 单 击 “ 导 入 ”按钮 。 


医 


选择 


RE A rr 


数字 图 像 与 视频 处 理 技术 

注 : 也 可 单 击 工具 栏 中 的 “任务 ”按钮 一 ， 然 后 根据 要 导入 的 数字 媒体 文件 的 类 型 ， 在 
“电影 任务 ” 窗 格 中 的 任务 “捕获 视频 ”中 ， 单 击 “ 导 入 视频 ”( 或 “导入 图 片 "、“ 导 入 音频 
或 音乐 ”) 链 接 ， 即 可 打开 “导入 文件 ”对 话 框 。 
3.9.3 ”编辑 视频 

首先 在 “内 容 ” 窗 格 中 选中 要 编辑 的 视频 片段 ， 然 后 将 其 拖 到 “情节 提要 视图 和 时 间 线 
视图 ”中 ， 如 图 3.27 所 示 。 编 辑 视频 时 ， 可 对 视频 进行 拆 分 、 合 并 、 剪 辑 等 操作 ， 具 体 步骤 
如 下 。 
































了 TREE IE OO TI3 








SA 297 : 拓 各 面 














拆 分 剪辑 可 以 将 一 个 视频 剪辑 拆 分 成 两 个 剪辑 。 如 果 要 在 剪辑 中 间 插 入 图 片 或 视频 过 渡 ， 
此 选项 将 非常 有 用 ， 操 作 步 又 如 下 。 

(1) 在 “内 容 ” 窗 格 中 或 在 情节 提要 /时 间 线 上 ， 单 击 所 要 拆 分 的 剪辑 。 

(2) 找到 要 拆 分 的 位 置 。 选 择 “播放 ”一 “播放 剪辑 ”选项 ， 待 播放 到 要 拆 分 的 位 置 后 ， 
选择 “播放 ”一 “和 暂停 剪辑 ”选项 ， 使 视频 在 要 进行 拆 分 的 点 暂停 。 

(3) 选择 “前 辑 ” 一 “ 拆 分 ”选项 。 

2) 合并 剪辑 

合并 剪辑 可 以 合并 两 个 或 多 个 连续 的 视频 剪辑 。 若 有 几 个 较 短 的 剪辑 并 要 在 情节 提要 /时 
间 线 上 将 它们 看 作 一 个 剪辑 ， 则 可 合并 剪辑 ， 操 作 步 骤 如 下 。 

在 “内 容 ” 窗 格 中 或 在 情节 提要 /时 间 线 上 ， 按 住 Ctrl 键 ， 然 后 选择 要 合并 的 连续 剪辑 。 
选择 “剪辑 ”一 “合并 ”选项 。 

3) 剪裁 剪辑 

剪裁 剪辑 可 以 隐藏 不 愿 显示 的 剪辑 片断 。 例 如 ， 可 将 一 个 剪辑 的 某 一 段 剪 裁 掉 。 前 裁剪 
辑 的 步骤 如 下 。 
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区 媒体 技术 发 其 应 用 (第 之 腑 ) 


一 (D) 在 “内 容 ” 窗 格 中 选中 要 裁剪 的 视频 片段 ， 然 后 将 其 拖 到 “情节 提要 视图 和 时 间 线 视 








”中 ， 如 图 3.27 所 示 。 

(2) 在 时 间 线 上 ， 选 择 要 剪裁 的 剪辑 。 

(3) 在 时 间 线 上 ， 单 击 播放 指示 器 并 将 它 拖 到 所 要 剪裁 剪辑 的 点 (或 使 用 监视 器 上 的 播放 
控制 定位 到 要 剪裁 剪辑 的 点 )。 当 播放 指示 器 位 于 要 开始 播放 选 定 的 视频 剪辑 或 音频 剪辑 的 点 
村， 选择 “剪辑 ”一 “设置 起 始 剪裁 点 ”选项 。 当 播放 指示 器 位 于 要 停止 播放 选 定 的 视频 前 
辑 或 音频 剪辑 的 点 时 ， 选 择 “剪辑 ”一 “设置 终止 剪裁 点 ”选项 ， 即 可 获得 一 段 从 “起 始 剪 
裁 点 ”到 “终止 剪裁 点 ”的 视频 。 

注 : 还 可 以 在 时 间 线 上 选中 剪辑 时 ， ee hg aan gs 
剪裁 剪辑 时 ， 并 不 是 将 剪裁 的 信息 删除 ， 而 只 是 将 这 些 信息 对 观众 隐藏 起 来 ， 这 样 ， 多 余 的 
部 分 就 不 会 出 现在 项 目 和 最 终 保存 的 pe 若 对 音频 剪辑 却 4 ei 或 过 少 ， 

则 可 以 在 Windows Movie Maker 中 调整 或 清除 已 建立 的 剪裁 SG 


视频 过 渡 、 视 频 效果 、 片 头 片 尾 A 


可 加 下、 信和 视频 效果 ， 以 及 片头 /片尾 。 
视频 过 渡 控制 电影 如 何 从 播放 一 段 剪辑 或 一 张 图 片 过 滤 到 播放 下 一 段 剪辑 或 下 一 张 图 片 
的 效果 。Windows Movie Maker NS 加 到 项 目 中 的 过 渡 。 过 渡 存 储 在 “收藏 ” 窗 
格 中 的 “视频 过 渡 ” 文 件 夹 内 。 

视频 效果 决定 了 视频 剪辑 3 A 头 在 项 目 及 ns 显示 方式 。 可 以 通过 视频 
st Zh 例如 ， 可 使 要 Me 

果 。 可 以 向 视频 剪辑 或 图 片 添加 某 一 种 “1 wR Windows Movie Maker 中 自 

带 了 53 种 特效 ,无 论 想 应 用 其 中 哪 re 只 需 将 相应 图 标 拖 至 故事 板 内 的 目标 剪辑 
文件 上 即 可 。 NS | 

通过 添加 片头 和 片尾 ， 可 以 向 电影 添加 基于 文本 的 信息 ， 如 电影 片 名 、 的 姓名 、 日 期 之 
类 的 信息 。 除 了 更 改 片头 动画 效果 外 ， 还 可 以 更 改 片头 或 片尾 的 外 观 ， 这 决定 了 片头 或 片尾 
在 电影 中 的 显示 方式 。 

1. 添加 视频 过 渡 效 果 

添加 视频 过 渡 效 果 的 步骤 如 下 。 

(1) 在 情节 提要 /时 间 线 上 ， 选 择 要 在 它们 之 问 添加 过 渡 的 两 段 视 频 剪辑 第 二 段 剪辑 (或 两 
张 图 片 中 的 第 二 张 图 片 )。 

(2) 在 “电影 任务 ” 窗 格 中 的 “编辑 电影 ”中 ， 单 击 “ 查 看 视频 过 渡 ” 链 接 ， 如 图 3.28 
所 示 。 

(3) 在 视频 过 渡 窗 格 中 选择 所 要 的 视频 过 渡 , 然后 选择 “剪辑 ”一 “添加 到 时 间 线 ”或 “ 添 
加 到 情节 提要 ”选项 。 

注 : 也 可 以 通过 将 视频 过 渡 拖 到 时 间 线 上 并 将 其 放 在 “视频 ” 轨 上 的 两 段 剪 辑 之 间 来 添 
加 视频 过 渡 。 


la6 





























3.9.4 使 


















































图 3.28 查看 视频 过 渡 界 面 

2， 添 加 视频 效果 

添加 视频 效果 的 步骤 如 下 。 

(1) 在 情节 提要 /时 间 线 上 ， 选 择 要 添加 视频 效果 的 视频 剪辑 (或 图 片 )。 

(2) 在 “电影 任务 ” 窗 格 中 的 “编辑 电影 ”中 ， 单 击 “ 查 看 视频 效果 ”链接 (如 图 3.28 所 示 )。 

(3) 选择 所 要 的 “视频 效果 ”。 < 

(4) 选择 “剪辑 ”一 “添加 到 时 间 线 ”或 “添加 到 情节 提要 ”选项 。 

注 : 也 可 以 通过 将 视频 效果 拖 到 时 间 线 上 并 将 其 歼 在 要 添加 视频 效果 视频 剪辑 上 。 

3， 添 加 片头 /片尾 

为 视频 剪辑 添加 片头 /片尾 的 步骤 如 下 。 

(1) 在 “电影 任务 ” 窗 格 中 的 “编辑 电影 ”中 ， 单 击 “ 制 作 片头 或 片尾 ”链接 ， 打 开 如 
图 3.29 所 示 的 操作 界面 。 











Same EXE 
ma 


[ 

















图 3.29 添加 片头 操作 界面 
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多 媒体 氢 术 及 其 应 用 (第 之 服 ) 
一 O) 在 “要 将 片头 添加 到 何 处 ? ”区 域 中 , 根据 所 需要 添加 片头 的 位 置 单 击 其 中 一 个 链接 ， 
如 单 击 “在 电影 开头 添加 片头 ”链接 。 
(3) 在 “输入 片头 文本 ”区 域 中 ， 输 入 要 作为 片头 显示 的 文本 ， 如 图 3.30 所 示 。 









































图 3.30 “为 视频 添加 片头 六 本 

(4) 单 击 “ 更 改 片头 动画 效果 ”链接 ， 然 后 在 “选择 片头 动画 ”区 域 中 选择 片头 动画 效果 。 

(5) 单 击 “ 更 改 文本 字体 和 颜色 ”链接 , "然后 在 “选择 片头 字体 和 颜色 ”区 域 选择 片头 的 
字体 、 字 体 颜 色 、 格 式 、 背 景 颜色 、 透 明度 、 字 体 大 小 和 位 置 。 

(6) 单 击 “ 完 成 ， 为 电影 添加 片头 ”链接 ， 便 完成 了 在 电影 中 添加 片头 操作 。 
3.9.5 “为 视频 剪辑 添加 背景 音乐 4 三 
利用 Windows Movie Maker 可 以 方便 地 为 视频 剪辑 (或 图 片 ) 添 加 背景 音乐 ,操作 步骤 如 下 。 
(1) 在 “内 容 ” 窗 格 中 选中 要 编辑 的 视频 片段 ,> 然后 将 其 拖 到 “情节 提要 视图 和 时 间 线 视 
图 "中 。 ANV SK 
(2) 在 电影 任务 窗 格 中 单 击 “ 导 入 音频 或 音乐 ” 链接 ， 选 择 所 要 添加 的 背景 音乐 , 便 在 收 
藏 窗 格 中 显示 背景 音乐 图 标 ， 如 图 3.31 所 示 。 



































图 3.31 为 视频 添加 背景 音乐 界面 
(3) 将 背景 音乐 图 标 拖 放 到 “情节 提要 视图 和 时 间 线 视图 ”中 。 
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3.9.6 ”保存 和 发 送 电影 




















使 用 “保存 电影 向 导 ” 可 以 快速 将 项 目 保存 为 最 终 电 影 。 项 目的 计时 、 布 局 和 内 容 将 保 








存 为 一 个 完整 的 电影 。 可 以 将 电影 保存 到 计算 机 或 可 写 入 的 CD 上 ， 或 者 以 电子 邮件 附件 的 
形式 发 送 或 发 送 给 Web 上 的 视频 宿主 提供 商 。 此 外 ， 还 可 以 选择 将 电影 录制 到 摄像 机 中 的 磁 





带 上 ， 操 作 步 又 如 下 。 


(1) 选择 
(2) 选择 


“文件 ”菜单 中 的 “保存 电影 文件 ”选项 ， 将 打开 如 图 3.32 所 示 的 对 话 框 。 
“将 电影 保存 到 计算 机 上 以 便 进行 播放 ”选项 ， 单 击 “ 下 一 步 ”按钮 。 














(3) 在 “为 所 保存 的 电影 输入 文件 名 ”文本 框 中 输入 文件 名 , 并 在 “选择 保存 电影 的 位 置 ” 
下 拉 列 表 中 选择 存放 位 置 。 单 击 “ 完 成 ”按钮 。 





注 : 除 指 


可 写 入 的 CD 纪 


电子 邮件 发 送 


只 要 全 村 
[7 


i 
EF Be pe x Runde 
i 





Ty 
入 图 3.32 “保存 电影 向 导 ” 对 话 框 


定 要 将 电影 保存 到 本 地 计算 机 或 共享 的 网 络 位 置 外 ， 还 可 指定 要 将 电影 保存 到 
或 可 重 写 的 CD(CD-R 或 CD-RW) 上 。 或 指定 将 电影 保存 为 电子 邮件 附件 以 通过 


它 。 


3.10 ”数字 视频 的 应 用 





随 着 视频 处 理 技术 的 日 趋 成 熟 和 应 用 的 不 断 深 入 ， 数 字 视 频 已 经 并 正在 用 于 社会 的 许多 
方面 。 其 应 用 领域 主要 有 以 下 几 方 面 。 


















































(1) 娱乐 出 版 。 数 字 视 频 在 娱乐 、 出 版 业 中 广泛 应 用 。 其 表现 形式 主要 有 VCD、DVD、 
视频 游戏 和 其 他 各 种 CD 光 稚 出 版 物 。 























(2) 广播 


电视 。 在 广播 电视 业 数 字 视 频 的 主要 应 用 有 : 高 清晰 度 电 视 (HDTV)、 交 换 式 电 


视 (ITV)、 视 频 点 播 (VOD)、 电 影 点 播 (MOD)、 新 闻 点 播 NOD)、 卡 拉 OK 点 播 (KOD) 等 。 
(3) 教育 训练 。 数 字 视 频 在 教育 、 训 练 中 的 应 用 主要 有 : 多 媒体 辅助 教学 、 远 程 教学 、 远 


程 医疗 等 。 
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(4) 数字 通信 。 数字 视频 的 实用 化 为 通信 业 提供 了 新 的 应 用 服务 ， 主要 有 : 视频 电话 、 视 


频 会 议 、 网 上 购物 、 计 算 机 支持 的 协同 工作 等 。 
(5) 监控 。 目 前 , 数字 视频 也 用 于 各 种 数字 视频 监控 系统 中 ， 这样 系统 的 性 能 优 于 模拟 视 
频 监控 系统 ， 有 着 广阔 的 发 展 前 景 











视觉 表示 媒体 中 ， 高 分 辨 率 的 数字 化 彩色 静止 图 像 和 全 运动 图 像 虽然 对 于 处 理 速度 、 存 
储 容 量 、 传 输 带宽 和 显示 精度 的 要 求 较 高 ， 但 也 更 加 引人入胜 。 

本 章 着 重 介绍 了 视频 的 基本 概念 ， 视 频 信号 的 特性 ， 视 频 信号 的 存储 ， 如 何 获取 、 编 辑 、 
播放 数字 视频 。 和 音频 数据 一 样 ， 视 频数 据 也 需要 压缩 。 视 频数 据 能 够 压缩 是 因为 视频 信息 
有 很 大 的 元 余 度 ， 较 为 著名 的 压缩 方法 主要 有 JPEG 和 MPEG。 i 本 章 还 介绍 了 视频 卡 




















的 结构 和 技术 特性 ， 以 及 数字 视频 的 应 用 领域 。 CS 
3.12 习 Ky 
填空 是 人 A 
(1) 图 像 数 据 的 获取 是 图 像 数 : 人 的 ep 程 实质 上 是 模拟 信号 的 数字 化 过 
程 ， 它 的 处 理 步骤 大 体 分 为 3 步 ” 第 。 第 3 步 ; 





(2) 图 像 分 辩 率 是 指 组 成 往 图 像 的 像素 密度 的 度 的 / hy 对 同样 大 小 的 - 一 幅 图 ， 着 
ra De 图 像 分 辨 率 的 单位 




















是 

(3) 页 @@ 空 oi 也 称 颜 色 模 型 。 显 示 彩 色 图 像 
的 电视 机 和 计 示 器 色彩 显示 原理 主要 基于 颜色 模型 。 

(4) 视频 信号 是 指 连 续 的 随 着 时 间 变化 的 -一 组 图 你 C4 帧 /84、25 帧 /s、30 帧 8)， 又 称 运动 
图 像 或 活动 图 像 。 常 见 的 视频 信号 按 其 特点 可 分 为 模拟 和 两 种 形式 。 








(5) 一 幅 1024X768 真 彩色 的 数字 图 像 ， 在 未 压缩 的 情况 下 所 占用 的 存储 空间 为 MB。 
(6) VCD 采用 的 压缩 标准 是 _ 








2. 选择 题 
(1) Windows XP 支持 目前 流行 的 多 种 多 媒体 数据 文件 格式 。 下 列 文件 格式 (类 型 ) 中 ，__ 均 
是 图 像 文 件 。 
A. GIF、 JPG 和 TIFF B. JPG、 MPG 和 BMP 
C. GIF、 BMP 和 MPG D. CDA、DXF 和 ASF 


(2) 数字 视频 信息 的 数据 量 相当 大 ,对 计算 机 的 存储 、 处 理 和 传输 都 是 极 大 的 负担 ,为 此 
必须 对 数字 视频 信息 进行 压缩 编码 处 理 。 目 前 DVD 光盘 上 存储 的 数字 视频 采用 的 压缩 编码 标 
准 是 

A. MPEG-1 B. MPEG-2 C. MPEG-4 D. MPEG-7 




















go 
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(3) 下 列 关 于 图 像 的 说 法 不 正确 的 是 。 
A. 图 像 的 数字 化 过 程 大 体 可 分 为 3 步 : 取样 、 分 色 、 量 化 
B. 像素 是 构成 图 像 的 基本 单位 
C. 尺寸 大 的 彩色 图 片 数 字 化 后 其 数据 量 必定 大 于 尺寸 小 的 图 片 的 数据 量 
D. 黑白 图 像 或 灰 度 图 像 只 有 一 个 位 平面 
(4) 一 幅 具 有 真 彩色 (24 位 )、 分 辩 率 为 1 024X768 的 数字 图 像 ， 在 没有 进行 数据 压缩 时 ， 
它 的 数据 量 大 约 是 __ 
































































































































A. 900KB B. 1200KB C. 3.75MB D. 2.25MB 

3， 判 断 题 

(1) GIF 格式 的 图 像 是 一 种 在 Internet 上 大 量 使 用 的 数字 媒体 ， 一 幅 真 彩 像 可 os 
成 质量 完全 相同 的 GIF 格式 的 图 像 。 ( 

(2) DVD 与 VCD 相 比 其 图 像 和 声 RR 梁 用 了 
准 为 MPEG-4。 ( ) 

G) MPEG 由 MPEG 视频 、MPEG 音频 和 MPEG sR ( ) 

(4) 视频 信号 的 时 间 特 性 可 用 视频 帧 率 刻画 。 NN 率 表 示 视 频 图 像 在 屏幕 上 每 秒 显 示 
帧 的 数量 ， 视 频 帧 率 越 高 图 像 抖动 越 小 。 XA ( ) 

4， 简 答题 \ 

(1) 什么 是 视频 卡 ? 有 哪 几 eK 

(2) 在 空间 上 和 ee 倍 何 表示 的 ? 六 让 











G) 什么 是 计算 机 图 像 处 理 灾 数 : 学 图 人 处理 技术 因 入 容 ? 
(图像 数 字 化 过 程 的 基本 步 双 是 什么 
(5) 图 像 数字 化 的 主要 设备 有 哪些 ? 站- 
(0 a 什么 是 真 彩色 ? 
(7) 颜色 深度 反映 了 构成 图 像 的 颜色 总 数目 ， 某 图 像 的 颜色 深度 为 16， 则 可 以 同时 显示 
的 颜色 数目 是 多 少 ? 
(8) 常见 的 数字 图 像 文件 格式 有 哪些 ? 
(9) 图 像 压 缩 的 目的 是 什么 ? 
(10) 如 何 利 用 Windows 系统 自 带 的 视频 制作 工具 制作 一 张 DVD? 
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加 。 多 媒体 数据 压缩 技术 


教学 提示 


> 多 媒体 数据 压缩 技术 是 多 媒体 技术 中 的 核心 技术 之 一 ， 它 揭示 了 多 
媒体 数据 处 理 的 本 项 闪 是 在 计算 机 上 实现 多 媒体 信息 处 理 、 存 储 和 
应 用 的 前 提 。 静态 图 像 和 视频 数据 压缩 国际 标准 的 制定 为 多 媒体 通 
信和 大 规模 应 用 提供 了 统一 的 技术 标准 。 学 习 和 掌握 多 媒体 数据 压 
缩 技 术 的 相关 知识 ， 是 深入 学 习 多 媒体 技术 其 他 知识 所 必 备 的 。 

教学 目标 

i 

六 一 在 本 章 中 ， 将 从 基础 理论 开始 ， 对 数据 压缩 的 基本 原理 与 方法 、 静 
态 图 像 压 缩编 码 国际 标准 JPEG 及 JPEG 2000、 运动 图 像 压缩 编码 国 
际 标准 中 ISO/IEC 制定 的 MPEG 系列 和 ITU-T 制定 的 H.26x 系列 进 
行 讲述 。 


| 
| — 


数字 多 媒体 技术 是 20 世纪 后 期 在 计算 机 应 用 领域 诞生 的 一 条 奇 基 , 它 为 计算 








机 的 大 规模 














普及 应 用 创造 了 必 备 的 技术 条 件 。 早 期 的 计算 机 只 能 处 理 文本 这 样 的 信息 ， 主 要 
和 工业 领域 ， 随 着 数字 多 媒体 技术 的 发 展 ， 尤 其 是 多 媒体 信息 压缩 编码 技术 的 发 
频 、 图 形 、 图 像 、 视 频 、 动 画 等 多 媒体 信息 在 普通 计算 机 中 的 应 用 成 为 可 能 。 多 
缩 技 术 的 目的 是 将 原先 比较 庞大 的 多 媒体 信息 数据 以 较 少 的 数据 量 表示 ， 而 不 影 
信息 的 识别 。 多 媒体 信息 在 计算 机 及 网 络 中 的 应 用 ， 极 大 地 改善 了 人 机 交互 的 方 
往 只 有 专业 人 员 使 用 的 计算 机 进入 了 寻常 百姓 家 。 随 着 多 媒体 信息 在 计算 机 中 的 
计算 机 在 承担 传统 任务 的 同时 ， 也 可 以 让 用 户 通过 计算 机 制作 图 文 并 茂 的 文档 、 
电影 、 远 程 语音 通信 、 在 线 视频 聊天 等 。 同 时 多 媒体 数据 压缩 技术 也 是 实现 数字 
机 和 信息 家 电 中 不 可 缺少 的 技术 ， 是 实现 信息 家 电 产 业 化 的 技术 前 提 。 多 媒体 数 
的 发 展 潜力 十 分 巨大 ， 具 有 极其 广阔 的 应 用 前 景 。 



















































































应 用 于 军事 
展 ， 使 得 音 
媒体 数据 压 
响 人 们 对 原 
式 ， 使 得 以 
大 量 应 用 ， 
听 音 乐 、 看 
高 清晰 电视 
据 压缩 技术 









































本 章 主 要 介绍 多 媒体 数据 压缩 技术 的 基本 原理 和 方法 ， 并 介绍 了 得 到 广泛 应 
大 的 相关 图 像 、 视 频 压缩 编码 国际 标准 及 其 新 技术 。 ,XK 
KK 


<\ 
.1 缩 的 基本 居 ; 
4 数据 压缩 的 基本 原理 和 方法 


AN 
数据 压缩 是 指 对 原始 数据 进行 重新 编码 ; | 内 去 原始 数 所 中 的 元 余 ， 以 较 小 的 























和 影响 





区 


数据 量 表 示 


原始 数据 的 技术 。 数据 压缩 技术 是 实现 在 计算 机 上 处 理 音 视频 等 多 媒体 信息 的 前 提 。 


数据 压缩 技术 可 分 为 两 种 类 型 > -种 是 无 损 压 缩 ， 一 种 是 有 损 压缩。 

无 损 压 缩 是 指 对 被 压缩 数据 进行 解 计 缩 (或 称 还 原 ) 时 > 解 讨 缩 得 到 的 数据 与 原 
人 ; 另 一 方面 ， 经 压 
经 过 解压 缩 又 可 以 得 到 没有 任何 损失 的 信息 还 原 "无 损 压缩 常用 于 对 信息 

况 下 ， 如 计算 机 程 席 原始 数据 文件 等 磁 各 交 件 > 水 目 前 的 技术 而 言 ， 无 可 压缩 
太 高 的 压缩 比 a 、| ~ 


i 
有 损 压 缩 是 指 对 被 压缩 数据 进行 解压 缩 时 ， 解 压缩 得 到 的 数据 与 原始 数据 不 

















始 数据 完全 
缩 后 的 数据 


还 原 要 求 很 高 的 情 


一 般 不 具有 


完全 相同 ， 


但 一 般 不 影响 人 对 原始 数据 所 表达 的 信息 的 理解 。 有 损 压 缩 常用 于 对 信息 还 原 要 求 不 太 严格 





的 情况 下 ， 如 音频 数据 的 压缩 ， 压 缩 的 目的 是 在 保证 所 需要 的 音频 质量 情况 下 ， 
压缩 原始 数据 ， 以 便 以 较 少 的 数据 量 表达 复杂 的 音频 信息 。 尤 其 是 在 视频 信息 的 有 























视频 信息 中 所 包含 的 信息 更 丰富 ， 其 中 信息 的 元 余 度 也 更 大 ， 所 以 在 保证 要 求 的 


尽 可 能 多 的 
E 缩 过 程 中 ， 





4 视频 质量 、 


丢掉 一 部 分 信息 而 不 至 于 影响 人 对 视频 信息 理解 的 情况 下 , 其 压缩 的 比例 也 就 可 以 更 高 一 些 ， 


从 而 达到 更 高 的 压缩 比 。 
4.1.1 数据 压缩 概述 











多 媒体 数据 区 别 于 文本 数据 的 突出 特点 之 一 就 是 数据 量 十 分 庞大 (尤其 是 视频 )。 如 一 部 
《红楼 梦 》 约 100 万 字 ， 如 果 用 文本 方式 保存 大 约 只 需 2MB。 而 对 于 音频 信息 来 说 ， 若 按 CD 
音质 (CD-A) 对 原始 音频 进行 不 经 压缩 的 数字 化 ， 以 CD-A 音频 标准 , 采样 频率 为 44.1kHz、 采 





样 精度 为 16bit/ 样 本 、 双 声 道 立体 声 ， 则 每 分 钟 的 数据 量 为 
44.1X103X16X2X60 二 8 二 220 一 10.1(MB) 


这 样 ， 一 张 CD-ROM 光盘 按 650MB 的 容量 来 计算 ， 只 能 存放 lh 的 CD 音乐 。 
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六 


本 多 媒体 技术 及 其 应 用 (第 2 版) 





以 不 经 压缩 的 静态 图 像 为 例 ， 目 前 家 用 数码 照相 机 的 分 辩 率 一 般 在 500 一 800 万 像素 ， 以 














500 万 像素 (2 578X 1 936) 为 例 ， 若 按 24 位 色 深 来 表达 ， 则 每 个 像素 点 需要 24 位 来 表示 ,存储 


这 张 


则 一 


的 MP@HL( 主 框架 和 高 级 别 ) 编 码 方案 )， 则 其 每 秒 钟 视频 数据 量 为 














图 片 所 需 的 磁盘 空间 为 





5 000 000X24 二 8 二 220 一 14.3(MB) 
张 128MB 的 存储 卡 ， 只 能 存储 8 张 照片 。 











以 计划 中 的 高 清晰 数字 电视 视频 数据 为 例 ， 其 最 高 分 辩 率 达 1 920X1 152( 采 上 





MPEG-2 








1920X1152X24 二 8 二 220X25 一 158.2(MB) 
由 一 张 CD-ROM 光盘 按 650MB 的 容量 来 计算 ， 只 能 存放 4s 的 高 清晰 电视 节 
多 媒体 信息 的 数据 量 过 大 使 得 利用 计算 机 对 多 媒体 数据 处 理 面临 很 大 的 困难 ， 
































目 。 
再 加 上 多 


媒体 数据 处 理 通常 还 有 实时 性 的 要 求 ， 多 媒体 信息 的 处 理 要 求 计算 机 具有 极 高 的 带宽 、 很 高 
的 运算 速度 和 “海量 ”的 存储 器 才能 完成 ， 人 所 以 


对 多 


4.1.2 


根据 
例 ， 


进 制 


外 体 原 娩 数据 经 过 压缩 ， 只 保留 有 用 的 信息 并 交 给 计算 机 处 班 就 可 以 解决 上 述 问题 
数据 压缩 的 基本 原理 XK | 


编码 是 指 将 各 种 信息 以 0、1 数字 序列 来 表示 > ,数据 庄 缩 编码 是 指 减 少 码 长 的 有 效 编码 。 
数据 压缩 编码 的 长 度 ， 可 以 将 编码 方法 分 汰 等 长 编码 和 不 等 长 编码 。 以 最 简单 的 情况 为 


下 面 看 一 看 数据 压缩 编码 的 基本 原理 *\ 、 

【 例 4.1】 对 字符 串 “aa bb cece ddid eeeeeeee” 进行 编码 。 

上 述 字符 串 的 每 一 个 字符 ， 在 AsGH 码 表 中 都 可 以 查 到 ,| 每 j 一 个 字符 对 应 用 - 
码 ， 存 储 时 占用 1 个 字 节 : 字符 与 其 ASCIL 编码 的 对 应 关系 见 表 4.1。 


,和 一 表 4-1 AS61A 


“3 ASCI 编码 于 -| ASCIl 编码 
00100000 ol100011 





-个 总 位 二 





唯一 


01100001 | a | 01100100 


01100010 


则 可 以 采取 以 下 几 种 编码 方式 。 
方式 1，ASCII 码 直接 编码 。 
对 每 一 个 字符 直接 写 出 其 ASCII 编码 为 : 
01100001 01100001 00100000 01100010 01100010……: 
上 述 字 符 串 的 编码 总 长 度 为 : 

24( 字 符 个 数 )X8( 每 个 字符 的 编码 长 度 ) 王 192(bib 
方式 2: 等 长 压缩 编码 。 


01100101 





取 每 一 个 字符 ASCII 码 的 后 3 位 进行 观察 ， 可 以 看 出 它们 各 不 相同 ( 即 可 以 通过 这 3 个 b 


识别 )， 如 只 取 每 个 字符 的 后 3 位 直接 编码 ， 则 新 的 码 字 序列 可 写 为 : 
001 001 000 010 010…… 
则 可 计算 出 编码 总 长 度 为 : 
24( 字 符 个 数 )X3( 每 个 字符 的 编码 长 度 ) 二 72(bit) 


-第 4 章 . 
| Es 
数据 压缩 比 为 37.5%。 
方式 3: 不 等 长 编码 。 
考查 字符 串 中 不 同 字符 出 现 的 概率 并 对 其 重新 定义 一 个 编码 见 表 4-2。 
表 4-2 字符 与 其 新 定义 的 编码 
出 现 次 数 
8 
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则 其 编码 的 总 长 度 为 LA 
8X1+4X3X3+2X4X2=60(bi) 
数据 压缩 比 达到 31.2%。 《A \\ 
与 之 对 应 ， 数 据 经 过 压缩 编码 后 ， 若 要 解 开 压 缩 的 数据 ， 则 可 采取 相应 的 解压 缩 方法 得 
到 (如 查 编码 表 )。 对 于 等 长 编码 方式 来 说 ， 解 压缩 过 程 比 较 简单 ， 只 要 从 压缩 编码 中 取出 n 


位 ， 就 可 以 得 到 对 应 的 一 个 原始 字符 ， 币 对 王 不 等 长 编码 来 说 ， 解 压缩 过 程 相对 复杂 一 些 。 
4.1.3 ”常用 的 数据 压缩 方法 ,站 XX 
1. 行程 长 度 


行程 长 度 编码 (游程 长 度 编码 ) 是 指 将 :系列 的 重复 值 (如 像素 值 ) 由 -个 单独 的 值 和 一 个 
计数 值 代替 的 编码 方法 。 行 程 长 度 编码 是 去 种 无 损 压缩 编码 方法 ， 它 是 视频 压缩 编码 中 最 简 
单 、 但 十 分 常见 的 方法 , 如 在 静态 图 像 压缩 编码 国际 标准 JPEG 可 就 采用 了 行程 长 度 编码 方法 。 

以 黑白 二 值 图 像 ( 仅 有 黑白 两 种 像素 构成 ) 为 例 , 由 于 图 像 中 相 邻 像素 之 间 存 在 较 大 的 相关 
性 ， 所 以 在 图 像 的 一 个 扫描 行 上 ， 它 总 是 由 若干 段 连续 的 黑色 像素 点 和 若干 段 连 续 的 白色 像 
素 点 构成 。 黑 ( 白 ) 像 素 点 连续 出 现 的 点 数 称 为 行程 长 度 . 黑 白 像素 点 的 行程 长 度 总 是 交 蔡 出 现 ， 
其 交 蔡 的 频 度 与 图 的 复杂 程度 有 关 。 

例如 ， 对 二 值 图 像 像素 序列 ， 如 图 4.1 所 示 。 


Oooooooo0eeeee000ee9e9eeeee00000O0 












































图 4.1 二 值 图 像 的 一 行 中 黑 、 白 像素 分 布 
按 行 程 长 度 编码 方法 可 编写 为 : 白 8 黑 5 白 3 黑 8 白 6…… 
































行程 长 度 编码 是 一 种 基于 统计 的 压缩 编码 方法 。 对 于 灰 度 图 像 和 色彩 不 太 复 杂 的 二 维 图 
像 来 说 ， 也 可 以 按照 相似 的 方法 进行 压缩 编码 。 对 于 出 现 概率 大 的 像素 ， 分 配 短 的 编码 ， 对 
于 出 现 概率 小 的 像素 可 分 配 长 的 编码 ， 以 达到 信息 压缩 的 目的 。 对 于 二 维 图 像 ， 除 可 以 按 上 
述 的 编码 方法 外 ， 还 要 考虑 相 邻 行 像素 之 间 存 在 的 相关 性 ， 如 在 JPEG 对 图 像 的 压缩 编码 中 ， 
就 采用 了 Z 形 扫描 方法 ， 得 到 一 个 扫描 序列 后 再 进行 编码 。 

行程 长 度 编码 最 适用 于 有 大 面积 颜色 相同 的 图 像 ， 可 以 取得 较 好 的 压缩 效果 。 在 实际 应 
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ee 一 多 若 你 乒 林 及 芮 应 用 (第 2 版 ) 
一 用 中 ， 对 二 值 图 像 、 灰 度 图 像 、 色 彩 不 太 丰 富 的 彩色 图 像 常 采 用 行程 长 度 编 码 方法 。 但 对 于 
竺 征 比 较 复杂 的 自然 图 像 (如 纯 随 机 的 “沙土 型 ”图 像 )， 编 码 效果 不 理想 。 
2， 预 测 编码 
自然 界 中 的 音频 和 视频 信息 都 是 连续 变化 的 模拟 信号 。 模 拟 信 号 是 无 穷 量 ， 计 算 机 要 对 
这 些 多 媒体 信息 进行 处 理 ， 必 须 将 模拟 信号 转化 为 有 穷 的 、 可 以 为 计算 机 处 理 的 数字 信号 ， 
并 在 保持 信息 和 可 理解 性 的 前 提 下 ， 尽 可 能 地 压缩 编码 的 数据 量 。 预 测 编码 的 基本 思想 是 根 
据 原 始 信号 的 相关 性 ， 在 当前 时 刻 ( 或 位 置 ) 预 测 下 一 时 刻 ( 或 位 置 ) 的 信号 值 ， 并 对 预测 出 现 的 
误差 进行 编码 的 压缩 编码 方法 。 一 般 而 言 ， 通 过 预测 产生 的 误差 信息 与 原始 信号 相 比 会 比较 
小 ， 所 以 对 误差 信号 进行 编码 就 可 以 用 较 小 的 值 来 表达 ， 这 样 可 以 压缩 编码 所 用 的 数据 长 度 ， 
即 缩短 了 编码 长 度 ， 从 而 达到 数据 压缩 的 目的 。 预 测 编码 主要 考虑 消除 两 个 方面 的 信息 元 余 : 
一 是 消除 存在 于 图 像 内 部 的 数据 元 余 ， 即 空间 元 余 度 ; 
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宛 余 ， 即 时 间 宛 余 度 。 
1) 消除 空间 宛 余 度 的 预测 编码 
空间 皂 余 度 可 能 出 现在 一 维 也 可 能 出 现在 二 维 空间 外 
(D 对 于 一 维 情况 下 的 原始 音 、 视 频 信号 ， 可 表示 为 如 图 4.2 所 示 。 
S 为 第 1 时刻 的 信号 采样 信 。 设 当前 信号 为 SX 则 对 下 一 时 刻 (第 ;时刻 ) 的 信号 预测 
法 可 表述 为 以 下 面 两 种 形式 。 A 
3 一 Si 佛法 1 NS- 
$1=2*5;-1—S;-2 (算法 AX 1 XU 
其 中 ，8% 为 第 ;时 刻 的 预测 值 3 了 - Xr 
则 经 过 预测 后 ， 预 测 值 与 实际 值 之 间 会 存在 一 个 预测 误差 和, 可 记 为 
< Ai 一 Sr py 


ef 
































CO) 二 维 情况 Ti， 图 像 中 相 邻 像素 点 之 间 的 关系 如 图 4.3 所 示 。 
_ XL LD) xD XL, -1) 
Sd We We ss XD XEN) MD 
图 4.2 一 维 信息 图 4.3 ”图像 中 相 邻 像素 的 位 置 关系 (二 维 信息 ) 


Xti, 四 为 第 i 行 第 j 列 像素 的 实际 值 。 
在 实际 图 像 中 ， 相 邻 像素 之 间 往 往 存在 较 大 的 相关 性 ， 所 以 对 X(i, 有 ) 像 素 点 的 预测 ， 可 
以 通过 相 邻 像素 值 的 运算 进行 预测 ， 常 用 以 下 3 种 预测 方式 。 











Xi, =[Xi—1, +Xi, j— D2 (算法 TD 
Xi, =[X(i—1, +Xit1, j—1)]/2 (算法 2) 
Xi, =Xi—1, —X(i—1, j—1)+Xi, j—1) (算法 3) 


其 中 ，X'(i, 为 第 i 行 第 j 列 位 置 像素 点 的 预测 值 。 
与 一 维 情况 下 一 样 ， 经 过 预测 后 ， 预 测 值 与 实际 值 之 间 会 存在 一 个 预测 误差 A (i, 有 ) 可 
记 为 
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Ali, DEXi, -Xi, 记 
依次 对 A (i, 四) 进行 编码 即 可 得 到 预测 压缩 的 编码 序列 。 


lg6 


na 
果 拓 计 巡 扩 | 


2) 消除 时 间 抑 余 度 的 预测 编码 
寺 间 完 余 度 出 现在 视频 的 帧 与 帧 之 间 。 在 连续 的 视频 图 像 中 ， 以 VCD 为 例 ， 标 准 要 求 每 
秒 播放 30 帧 ， 则 在 相 邻 两 帧 之 间 的 相关 性 很 大 ， 差 别 非常 小 。 这 样 在 进行 预测 压缩 编码 时 ， 
可 利用 上 一 帧 图 像 中 的 数据 去 预测 下 一 帧 图 像 。 若是 设计 比较 好 的 预测 算法 ， 则 经 过 预测 后 
产生 的 误差 与 原始 视频 信号 相 比 ， 大 部 分 误差 为 0 或 接近 于 0， 少 数 点 上 存在 一 些 误差 ， 则 
经 预测 后 的 编码 序列 将 会 比较 短 。 帧 间 存 在 的 时 间 宛 余 如 图 4.4 所 示 。 帧 间 预 测 不 直接 传送 
当前 的 像素 值 ， 而 是 传送 和 其 前 一 帧 对 应 像素 间 的 差 值 。 
不 管 是 对 消除 空间 宛 余 度 方面 还 是 时 间 宛 余 度 方面 的 预测 , 多 数 情 况 下 都 存在 预测 误差 。 
和 原始 信号 相 比 ， 误 差 是 一 个 比较 小 的 量 ， 所 以 可 以 用 比 
较 少 的 比特 数 来 编码 。 这 是 预测 编码 能 够 对 视频 信息 进行 
压缩 的 本 质 。 
预测 编码 算法 简单 、 易 操作 ， 计 算 复杂 度 不 高 ， 有 较 
高 的 编 解码 效率 ， 所 以 基于 预测 编码 技术 的 传统 算法 得 到 。 
广泛 应 用 , 如 DPCM( 差 分 脉冲 编码 调制 ) 方 法 、 A 
适应 差分 脉冲 编码 调制 ) 方 法 、 DMG8 量 讽 册 为 
ADM( 自 适应 增 量 调制 ) 方 法 等 。 ee XL) 
发 展 , 基于 预测 编码 的 新 算法 不 断 涌现 并 得 到 湾 用 ， ee 
如 LPC( 线 性 观测 红 友 ) 广 法 、APC( 自 适应 预测 编码 六 法 BR 
MPC( 多 脉冲 线性 预测 编码 ) 方 法 、CELEC( 码 激励 线 性 预测 
久 码 ) 广 法 等 。 这 些 算法 被 广泛 应 用 和 

3， 变 换 编码 4 x 


尖 光 全国 的 站 志 岂 让 站 红 宙 汪 法 0 A 即 DCT) 先 改变 表示 图 像 的 模式 
(如 RGB 模式 一 YUV. 模 式 )， 再 对 变换 得 到 的 释 换 信号 进行 量化 取 整 和 编码 的 技术 。 变 换 编 
码 不 直接 对 原始 的 空域 信号 (基于 空间 的 视频 信号 ) 进 行 编码 , 而 是 首先 将 空域 信号 映射 到 另 一 
个 正 交 矢 量 空间 (如 以 可 见 光 频率 表示 的 图 像 频 域 空间 ), 经 过 这 样 的 变换 后 , 将 得 到 一 批 变换 
系数 ( 即 基 信号 )， 再 对 这 些 系 数 进行 编码 的 技术 。 在 这 个 变换 的 过 程 中 ,常用 的 正 交 变换 是 最 
佳 正 交 变换 一 一 K-L 变换 和 次 最 优 正 交 变换 一 一 DCT 两 种 。 尤 其 是 DCT 变换 , 在 近年 来 被 广 
泛 应 用 于 数字 图 像 处 理 和 视频 压缩 编码 技术 中 。 

离散 余弦 变换 的 优势 在 于 其 压缩 变换 的 性 能 和 误差 与 最 佳 正 交 变换 一 一 K-L 变换 非常 接 
近 ， 但 其 计算 复杂 度 要 比 K-L 变换 要 小 ， 而 且 还 具有 可 分 离 特性 (有 选择 地 压缩 编码 )、 快 速 
算法 等 特点 。 从 20 世纪 90 年 代 以 后 的 数字 图 像 压 缩 和 视频 压缩 技术 中 ，DCT 变换 广泛 应 
于 JPEG、MPEG、H.26x 等 国际 或 行业 标准 中 ， 成 为 计算 机 多 媒体 技术 中 的 基本 压缩 算法 之 
一 。DCT 变换 可 表示 为 
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Fluw)= 4 CO DG Deos ET) cos CE) ] 
其 中 
| 
-1 
c= “ 
1 z#0 
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-一 ”利用 DCT 变换 对 图 像 进 











模式 ， 利 用 DCT 变换 ， 可 以 











行 处 理 的 原理 可 以 理解 为 : 在 计算 机 中 , 一 般 图 像 的 模式 为 RGB 
将 以 RGB 色 度 空间 表达 的 图 像 变换 为 用 YUV(Y 表示 亮度 ，U、 



































V 表示 色 度 差 ) 色 度 空间 表达 ， 在 对 一 个 具有 mXn 个 像素 的 图 像 块 进行 变换 的 过 程 中 ， 产 生 
mXn 个 正 交 基 信 号 ( 即 变换 系数 )， 每 个 基 信 号 对 应 于 独立 二 维 空间 频率 中 的 一 个 ， 这 些 频率 
































对 图 像 经 过 DCT 变换 编 











换 ， 可 将 图 像 变 换 回 RGB 色 








4. 矢量 量化 编码 

















由 输入 信号 的 频谱 组 成 。 对 正 交 基 信号 量化 取 整 后 ， 再 进行 编码 就 可 以 得 到 相应 的 压缩 编码 。 


码 后 , 可 利用 离散 余弦 变换 的 逆 变 换 (IIDCT) 对 编码 数据 进行 逆 变 
度 空间 ， 从 而 实现 图 像 的 解压 缩 ， 图 像 得 到 还 原 。 














矢量 量化 编码 是 一 种 有 失真 的 压缩 编码 方法 ， 是 近年 来 在 图 像 压 缩编 码 和 音频 压缩 编码 
技术 中 应 用 比较 多 的 一 种 新 型 量化 编码 方法 。 矢 量 量化 是 相对 于 标量 量化 而 言 的 。 标 量 是 指 
对 只 有 大 小 、 没 有 方向 或 其 他 限制 的 量 , 标量 量化 是 一 次 只 对 单个 采样 点 量化 的 技术 (如 PCM 
方法 )， 矢量 是 指 既 有 大 小 、 又 有 方向 或 其 他 限制 的 量 ， 矢 量 量 化 是 指 一 次 对 多 个 具有 相关 性 
































的 采样 点 进行 的 量化 的 技术 。 


矢量 量化 编码 技术 流程 如 图 4.5 所 示 。 ， R \ 
人 解码 


输入 失 昔 
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输出 失 划 
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1 Nr 
直 图 4.5 ”矢量 量 化 编码 与 解码 流程 


矢量 量化 过 程 中 , 对 于 给 定 的 矢量 X， 在 码 本 中 进行 比较 得 到 一 个 与 X 最 为 接近 的 矢量 
站， 则 码 本 矢量 基 在 码 本 中 的 矢量 编号 了 即 为 交 的 量化 值 。 这 样 ， 对 于 革 个 矢量 X 在 编码 时 
全 


可 以 用 一 个 编号 i 进行 编码 。 


A 
矢量 量化 以 将 多 个 复杂 的 采样 点 编码 量化 到 一 个 码 本 矢量 的 编号 ， 进 而 对 这 一 矢 





量 编号 进行 编码 。 只 要 有 码 本 和 相应 的 编号 ， 就 可 以 快速 解码 ， 所 以 可 以 极 大 地 压缩 编码 率 。 
矢量 量化 的 关键 是 设计 一 个 能 体现 矢量 关键 特征 的 码 本 。 





5. 炳 编码 


行程 长 度 编码 、 预 测 编码 、 变 换 编码 和 矢量 量化 编码 等 几 种 编码 方法 ， 都 是 从 消除 信息 
元 余 度 方面 来 考虑 的 。 压 缩 算 法 的 实质 是 将 原始 信息 中 的 多 余部 分 去 除 ， 以 较 小 的 编码 数据 
来 表示 原始 信息 。 炉 编码 则 是 一 种 基于 统计 的 、 可 变 码 长 的 压缩 编码 方法 ， 它 从 另外 一 个 方 

















1) 炉 及 其 计算 





























面 来 考虑 压缩 编码 : 首先 将 原始 信息 中 所 有 不 同 的 信息 (也 称 为 事件 ) 进 行 统计 , 将 出 现 概率 最 
多 的 信息 赋予 最 短 的 编码 ， 将 出 现 概率 较 少 的 信息 赋予 较 长 的 编码 ， 以 缩短 平均 编码 长 度 。 


炉 用 于 表示 一 个 事件 所 包含 的 信息 量 大 小 。 信 息 量 越 大 ， 表 示 事 件 的 不 稳定 性 越 大 ， 则 
对 该 事件 进行 编码 时 就 需要 更 多 的 比特 数 。 假设 N 为 待 编码 的 信息 集 ( 如 一 幅 图 像 中 的 像素 色 














彩 等 级 )， 刀 为 某 事 件 (如 图 像 中 的 某 种 色彩 ) 出 现 的 概率 ， 则 妃 的 信息 量 4 可 记 为 





los 





A=logs(1/P) 
=—logP 


| 
则 信息 集 N 的 平均 信息 量 为 
1 一 六 POlog:PO) (i=1, *…, N) 

厅 即 为 信息 精 。 上 式 可 以 证 明 ; 当 所 有 事件 的 概率 相等 时 ， 杂 最 大 ， 当 只 有 一 个 事件 的 
概率 为 1， 而 其 他 事件 概率 为 0 时， 万 最 小 。 

在 多 媒体 压缩 编码 技术 中 ， 信 息 燃 的 引入 主要 用 于 解决 信息 压缩 编码 的 极限 问题 ， 对 于 
某 一 个 信息 集 N， 若 其 中 包含 了 i 个 事件 ,每 个 事件 的 编码 长 度 为 C， 对 应 的 概率 为 户 的 话 ， 
则 信息 集 N 中 每 个 事件 的 平均 编码 长 度 可 记 为 
(均码 长 )= 2 xx 月 












































则 一 个 编码 方案 是 否 是 最 佳 编码 ， 可 以 下 式 来 验证 
HSLEH+1 

实践 证 明 : 若 工 远 远大 于 #H， 则 该 编码 为 非 最 佳 编码 ， i 

一 步 压缩 ; 车 工 小 于 及, 证 明 是 不 可 实现 的 。 a en 

2) 灶 编 码 实 例 一 一 哈 夫 曼 编码 

哈 夫 曼 (Huffman) 编 码 方法 于 1952 年 问世 ， 是 < 测 兴 型 的 摘编 码 ， 关 被 广泛 应 用 于 现代 
数字 图 像 处 理 技术 中 ， 如 JPEG、MPEG、 和 HE26X 等 压缩 标准 中 。 哈 夫 曼 编码 过 程 采 用 变 字 
长 的 编码 方法 ， 编 码 过 程 中 ， 编码 器 对 不 同 概率 的 信息 输出 的 编码 长 度 不 同 。 对 于 大 概率 信 
息 符号 ， 赋予 短 字 长 的 输出 (编码 )， 对 下 小 概率 的 信息 符号 ， 赋予 长 字 长 的 输出 (编码 )。 已 证 
明 ， 按 照 概率 出 现 的 大 小 顺序 ， ,对 移出 克 字 分 本 不 同 友 长 妆 字 长 编 蚂 方法 其 输出 的 编码 
平均 码 长 最 短 ， 与 信息 糯 理 论 值 接 这 是 种 最 侍 的 夺 统 编码 方法 。 以 一 幅 图 像 的 哈 夫 曼 编 
码 为 例 ， 其 算法 可 描述 为 :- 四 

(0 对 图 人 中 出现 区 丰富 克 素 人 进行 概 素 统 应 得 到 个 不 同村 的 信息 符号 。 

(2) 按 符 号 出 现 的 慨 率 由 大 到 小 、 由 上 到 下 排列 。 

(3) 对 两 个 最 低 概率 符号 分 别 以 二 进 制 0> 1 赋值 

(4) 两 最 低 概率 相 加 后 作为 一 个 新 符号 的 概率 重新 置 入 符号 序列 中 。 

(5) 对 概率 按 从 大 到 小 重新 排列 。 

(6) 重复 (2) 一 (5)， 直 到 只 剩 下 两 个 概率 符号 的 序列 。 

(7) 分 别 以 二 进 制 0、1 赋值 后 ， 以 此 为 根 节 点 ， 沿 赋值 的 顺序 的 逆序 依次 写 出 该 路 径 上 
的 二 进 制 代码 ， 得 到 哈 夫 曼 编码 。 

【 例 4.2】 根据 表 4-3 中 的 信息 及 出 现 的 概率 ， 写 出 其 哈 夫 曼 编码 。 






































表 4-3 信息 及 出 现 的 概率 


信息 02 
出 现 概率 0.14 0.07 0.07 | , 0.01 


上 述 信息 按 哈 夫 曼 编 码 方法 ， 其 编码 过 程 如 图 4.6 所 示 。 

哈 夫 曼 编码 的 过 程 形成 了 一 个 二 叉 树 ， 上 例 的 哈 夫 曼 编 码 形成 的 二 叉 树 如 图 4.7 所 示 。 
在 编写 哈 夫 曼 编 码 时 ， 只 要 从 根 节点 开始 ， 沿 根 节点 到 编码 节点 的 路 径 依次 写 出 各 段 的 权 值 
即 可 得 到 哈 夫 曼 编码 。 
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位. 
2 






四 一 多 天 条 技术 大 鞭 应 用 (第 县) 

信息 出 现 概率 烂 编码 
00 0 
01 100 
10 101 
02 1100 
20 1101 
11 1110 
12 11110 
21 111110 
22 111111 





图 4.6” 哈 夫 曼 编码 过 程 XK 从 
SN 


,A 





> 
了 
图 4.7， 哈 夫 曼 编码 的 二 又 树 


哈 夫 曼 编 码 的 最 终结 果 包含 了 一 个 可 供 查询 的 哈 夫 曼 表 ， 每 个 信息 符号 与 其 对 应 的 编码 
一 一 对 应 。 在 解码 过 程 中 ， 对 于 输入 的 编码 值 ， 可 通过 查询 哈 夫 曼 表 而 快速 得 到 信息 符号 


所 以 哈 夫 曼 方法 的 解码 速度 比较 快 ， 是 一 种 成 熟 、 优 秀 的 压缩 算法 。 
6， 算术 编码 








算术 编码 也 是 一 种 基于 统计 的 压缩 编码 方法 。 算 术 编码 中 ,信息 符号 








0 一 1 的 实数 进行 


编码 。 算 术 编 码 以 符号 的 概率 和 它 的 编码 间隔 为 参数 ， 信 息 符号 的 概率 决定 了 压缩 编码 的 效 
率 ， 也 决定 了 编码 过 程 中 信息 符号 的 间隔 ， 而 这 些 间 隔 包 含 在 0 一 1。 编 码 过 程 中 的 间隔 决定 








了 符号 压缩 后 的 输出 。 下 面 以 具体 的 例子 说 明 算 术 编 码 的 编码 与 解码 过 程 。 

















【 例 4.3】 一 个 信息 符号 集 为 {00，01，10，11}， 每 个 符号 对 应 的 概率 分 别 为 {0.1，0.4， 
0.2，0.3}， 当 输入 的 信息 符号 序列 为 10 00 11 00 10 11 01 时 ， 写 出 其 算术 编码 及 解码 过 程 。 








编码 过 程 中 ， 首 先 按 概率 确定 每 个 符号 所 在 的 编码 区 间 。 对 于 一 个 编码 信息 集 ， 所 有 的 
信息 符号 的 总 概率 和 为 1。 所 以 可 以 0 为 起 点 , 1 为 终点 , 将 信息 符号 依次 对 应 到 一 个 区 间 
则 符号 00 在 [0，0.D 内 ，01 在 [0.1，0.5) 内 ，10 在 [0.5，0.7) 内 ，11 在 [0.7，]) 内 。 

对 于 输入 的 信息 符号 序列 ， 第 一 个 输入 的 符号 为 10， 则 可 判断 其 信息 编码 落 在 [0.1，0.5) 








foo 

















Be 有 


多 媒体 数据 压缩 投 术 区 


当 第 二 个 符号 00 输入 时 ， 对 上 一 符号 所 在 区 间 仍 按 信息 符号 的 概率 再 进行 一 次 区 间 划 分 ， 它 落 

在 [0.5，0.7) 的 第 一 个 10 处 ， 即 它 的 区 间 为 [0.5，0.52); 当 第 三 个 符号 11 输入 时 ， 对 区 间 [0.5， 

0.52) 再 按 前 面 的 方法 进行 区 间 划分 ， 则 可 知 其 落 在 [0.514，0.514 6]; 依 此 类 推 ， 如 图 4.8 所 示 。 
计 息 符 革 所 在 的 编码 区 间 












































信息 符 分 00 ol 10 11 
一 
10 0 0 0.5 0.7 1 
三- 一 
00 05 0.52 0 
11 0;5 0.514 0.52 
三 -OO 
00 0.514 0.5146 0.52 
Eee Se 
10 0.514 0.5143 051447 0.5146 
] 
11 0.5143 0.514 384 0.514 42 
J 
01 0.514384 0.514 402 0.514 42 
0.514 3876 “(输出 结果 为 在 此 区 间 内 的 任 一 二 进 制 数 ) 0.514 402 


图 4:8 算术 编码 的 过 程 
这 样 ， 对 于 输入 的 信息 符号 序列 10 00 11 00 1041K01” 其 算术 编码 应 落 在 0.514 387 6 一 
0.514 402 这 个 区 间 内 ， 所 以 区 间 内 的 任 一 数据 都 可 表达 出 该 符号 序列 。 
解码 时 ， 对 于 给 出 的 一 个 解码 序列 ， 如 (0:5I4 39)io， 其 解码 过 程 如 图 4.9 所 示 。 
信息 符 外 所 5 的 的 编码 区 间 














输入 编码 00 01 10 11 解码 结果 
0.5 0 0.1 0.5 0.7 和 10 
三 二 -OO 
0.51 0.5 0.52 07 00 
上 一 一 一 一 
0.514 0.5 0 052 1l 
0.5143 0514 0.5146 0.52 00 
L 
0.514 38 0.514 0.5143 051442 0.5146 10 
] L 
CO 
0.514 384 0.5143 0.514 384 0.51442 11 
] 
0.514 39 0.514 384 0.514 402 0.51442 ol 


图 4.9 算术 编码 的 解码 过 程 
注 : 水 为 输入 编码 在 解码 的 不 同 阶段 所 处 的 区 间 及 位 置 。 
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一 ”上 例 中 解码 过 程 是 在 已 知 编码 长 度 的 情况 下 进行 的 ， 对 于 未 知 长 度 的 解码 过 程 ， 只 需要 























设置 一 个 终止 符 用 于 终止 解码 过 程 即 可 。 
算术 编码 是 基于 统计 的 编码 方法 ， 需 要 对 待 编码 的 信息 符号 进行 概率 估计 ， 但 实际 编码 
过 程 中 ， 要 做 到 准确 估计 是 十 分 困难 的 ， 而 且 在 编码 过 程 中 估计 的 概率 会 随 着 输入 信息 符号 
的 变化 而 变化 。 算 术 编码 对 整个 输入 的 消息 序列 只 产生 一 个 码 字 ， 其 译 码 过 程 中 要 求 将 全 部 
编码 输入 后 才能 正确 解码 。 同 时 ， 算 术 编 码 又 是 一 种 对 错误 敏感 的 压缩 方法 ， 如 果 码 字 是 传 
递 了 错误 的 编码 ， 将 导致 整个 解码 的 失败 。 理 论 上 讲 ， 算 术 编 码 比 哈 夫 曼 编码 更 具 压 缩 的 优 
势 。 据 JPEG 成 员 测试 ， 对 于 许多 图 像 ， 算 术 编 码 的 压缩 效果 比 哈 夫 曼 编码 的 压缩 效果 要 好 
5%~10%。 

7， 其 他 编码 技术 

在 传统 的 压缩 技术 中 ， 对 于 没有 统计 特性 或 无 法 事先 进行 统计 的 信息 符号 ， 不 少 学 者 提 
出 了 一 些 很 优秀 的 压缩 编码 方法 ， 这 些 方法 ， 统 称 为 通用 编码 技术 ; 湛 中 的 代表 算法 为 词典 
编码 方法 。 在 词典 编码 技术 中 ，LZ77 算法 、LZSS 算法 、 L278 算法 及 LZW 算法 等 都 是 较 有 
代表 性 的 词典 压缩 编码 算法 。 EN 

进入 20 世纪 90 年 代 ， 图 像 压 缩编 码 技术 研究 估 开 卫 个 重要 方向 “是 多 分 关于 编 
(Multiresolution Coding); 二 是 金字 塔 编码 (Pyr idCading)。 尤其 在 多 分 辩 率 编码 技术 上 发 展 
起 来 的 分 波 编码 和 小 波 编码 技术 十 分 引 人 注 全 > 

人 
射 变换 ) 实 现 。 其 本 质 在 于 保存 极 小 量 的 仿 射 变换 系数 来 取代 存储 大 量 的 图 像 数据 。 它 的 特点 
是 图 像 压缩 比 要 比 经 典 方法 高 得 多 ; 压缩 和 解压 缩 不 对 称 ; 座 缩 慢 但 解压 缩 快 ; 与 分 辩 率 无 关 。 

小 波 变换 编码 技术 的 基本 原理 是 对 整 幅 图 像 进行 变换 ， 采 用 小 波 变换 的 本 质 是 对 一 由 图 
像 进行 高 通 和 低 通 渡 波 ,对 不 同 的 频带 上 的 图 像 部 分 可 采用 不 同 的 量化 技术 进行 量化 。 其 主 
要 依据 是 变换 后 的 各 级 分 辩 率 的 图 像 之 间 自 相 似 的 特点 , 采用 逐 级 逼近 技术 来 实现 减少 编码 的 
数据 量 。 它 的 特点 是 适应 性 广 ， 可 适用 于 各 种 视频 数据 的 压缩 ， 压 缩 比较 高 ， 可 达到 300 : 1 
或 450 : 1， 压缩 速度 较 快 ， 压 缩 精度 较 高 。 















































4.2 ”静态 图 像 的 压缩 标准 


4.2.1 “JPEG 标准 简介 


JPEG 是 指 由 国际 标准 化 组 织 和 国际 电报 电话 委员 会 联合 成 立 的 专家 组 联合 制定 的 一 个 
适用 于 连续 色调 、 多 级 灰 度 、 彩 色 或 单 色 静止 图 像 数 据 压 缩 的 国际 标准 。JPEG 方案 的 问世 ， 
在 多 媒体 技术 领域 产生 了 巨大 的 影响 ,并 迅速 应 用 于 视频 压缩 编码 国际 标准 MPEG 中 。JPEG 
以 其 较 大 的 压缩 比 和 很 好 的 压缩 效果 ， 对 网 络 多 媒体 的 应 用 、 多 媒体 系统 集成 等 产生 了 极其 
重要 的 推动 作用 。 
987 年 6 月, JPEG 从 全 球 征集 来 的 12 个 静态 图 像 压 缩编 码 方案 中 , 筛选 出 了 3 个 方案 ， 
并 对 其 进行 了 改进 。1988 年 1 月 ， 确 定 其 中 的 以 8X8 DCT 为 基础 的 “ADCT"” 方案 的 画面 质 
量 最 好 ，1991 年 被 确定 为 国际 标准 。 以 JPEG 有 损 压缩 方式 、 压 缩 比 为 25 : 1 对 图 像 进行 压 
缩 处 理 ， 压 缩 后 的 图 像 与 原 图 像 比较 ， 用 肉眼 几乎 分 辨 不 出 它们 之 间 的 差别 ， 而 数据 量 仅 为 
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原始 图 像 的 1/25。1997 年 3 月 ，JPEG 又 开始 着 手 制定 用 于 静态 图 像 压 缩 的 更 优秀 的 方案 ， 
该 方案 采用 以 小 波 转换 (Wavelet Transform) 为 主 的 多 解析 编码 方式 ， 并 命名 为 PEG2000， 并 
于 1999 年 11 月 公布 为 国际 标准 ， 成 为 图 像 压缩 领域 又 一 项 具有 划时代 意义 的 技术 。 


4.2.2 JPEG 标准 中 的 主要 技术 


在 ISO 公布 的 JPEG 标准 方案 中 ， 包含 了 两 种 压缩 方式 。 一 种 是 基于 DCT 变换 的 有 损 压 
缩编 码 方式 , 它 包含 了 基本 功能 和 扩展 系统 两 部 分 ; 一 种 是 基于 空间 DPCM( 预 测 编码 的 一 种 ) 
方法 的 无 损 压缩 编码 方式 。 这 两 种 方式 中 ， 基 于 DCT 的 压缩 编码 方式 虽然 是 有 损 压 缩 ， 但 它 
可 用 较 少 的 编码 得 到 较 好 品质 的 还 原 图 像 ， 所 以 作为 JPEG 标准 的 基础 。 另 一 方面 ， 基 于 二 
维 空间 的 DPCM 压缩 编码 方法 虽然 压缩 比较 低 ， 但 可 实现 图 像 的 无 失真 还 原 ， 可 满足 对 图 像 
还 原 要 求 较为 苛刻 的 处 理 环境 ， 如 卫星 图 像 、 遥 感 图 像 的 处 理 等 。 为 实现 标准 的 完整 性 ， 所 
以 也 作为 标准 的 一 部 分 。 在 JPEG 标准 中 采用 的 相关 技术 主要 分 为 地 个 部 分 。 
在 有 损 压缩 编码 的 基本 功能 (Baseline) 部 分 ,主要 采用 对 8X8 像素 块 的 DCT 变换 ,对 DCT 
系数 采用 Z 形 扫描 得 到 数据 序列 并 使 用 哈 夫 曼 编码 ， 给 入 氏 人 为 们 ， 编码 图 像 还 原 后 
人 一 幅 图 像 的 开始 处 (左上 角 ) 依 次 解码 
显示 。 

在 有 损 压缩 编码 的 扩展 功能 部 分 ， 采 用 对 i 
形 扫描 得 到 数据 序列 并 使 用 哈 夫 曼 编码 ， A 精度 为 12 位 ,编码 图 像 还 原 后 的 显示 方式 
为 累进 方式。 累进 方式 是 指 图 像 的 解码 是 示 接 复合 显示 程序 ， 由 - - 幅 粗 略 的 图 像 概貌 开始 ， 
逐步 细 化 到 一 幅 完整 的 清晰 图 像 。 < 、 

在 无 损 压 缩编 码 部 分 ， 二 一人 空间 的 ,DEC 宙 il， 输入 图 像 精 度 2 一 
16bit， 对 预测 编码 进 - pg 用 关机 加 你 


423 JPEG 标准 对 图 的 压缩 过 程 、 半 - 


JPEG 压 的 基 相国 中 人 gxX8 像素 块 ， 所 以 JPEG 在 压缩 开始 之 前 需要 把 
原始 图 像 分 割 为 者 干 个 8X 8 像素 块 。 压 缩 开始 ， 按 照 从 上 到 下 、 从 左 到 右 的 顺序 ， 依 次 对 8 
X8 像素 块 进行 DCT 变换 ， 对 变换 系数 量化 后 再 进行 焙 编 码 ， 并 输出 压缩 图 像 的 编码 数据 。 
解压 缩 过 程 是 压缩 过 程 的 逆 过 程 ， 并 最 终 得 到 还 原 重 构 的 图 像 。JPEG 的 压缩 /解压 缩 过 程 如 
图 4.10 所 示 。 






























































































































































图 4.10 ”JPEG 编码 与 解码 流程 
对 有 关 JPEG 的 编码 与 解码 过 程 中 的 几 个 问题 说 明 如 下 。 
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0 下 区 媒体 扩 及 其 应 用 (第 2 版 ) 
1. DCT 变换 
DCT 变换 用 于 将 RGB 色彩 空间 的 图 像 信号 变换 为 以 YUV 频率 空间 表达 的 图 像 信 号 。 变 
换 后 ， 每 一 个 像素 点 对 应 形成 一 个 变换 系数 。 这 样 每 一 个 8X8 像素 块 经 DCT 变换 后 得 到 了 
64 个 变换 系数 ， 这 些 系数 是 进行 下 一 步 编码 的 依据 。 经 过 DCT 变换 ， 图 像 的 频率 信息 被 集 
中 在 少数 几 个 系数 中 ， 大 部 分 的 系数 值 为 0。 这 为 图 像 的 压缩 打下 了 良好 的 基础 。DCT 使 
8X8 像素 块 进行 变换 的 原因 还 在 于 当 像 素 块 小 于 8X8 时 ， 采 用 变换 处 理 可 能 带 来 块 与 块 之 
间 边界 上 存在 着 被 称 为 “边界 效应 ”的 不 连续 点 。 实 验证 明 ， 当 像素 块 小 于 8X8 时 ， 边 界 效 
应 明显 ; 而 像素 块 过 大 ， 虽 然 可 以 得 到 更 佳 的 压缩 效果 和 重 构 图 像 质量 ， 但 在 应 用 上 已 没有 
太 多 的 实际 意义 ， 而 变换 过 程 的 计算 量 将 在 大 幅度 增加 ， 对 计算 机 性 能 要 求 高 ， 实 现 起 来 比 
较 困 难 。 
2， 量 化 
量化 是 对 DCT 变换 的 系数 进行 的 ， 人际 上 是 一 个 了 和 可 表示 为 
Ruv 王 round(SuwVOuy) 
其 中 Sw 为 DCT 变换 得 到 的 数据 ，Cuv 为 某 个 整数 -过 来 自 于 量化 表 。 量化 的 目的 是 减少 
非 “0” 系 数 的 幅度 并 增加 “0” 值 系数 的 数量 。 量化 的 果 直 接 导致 了 失真 的 出 现 ， 也 是 导 
致 图 像 质量 下 降 的 主要 原因 。 Me 但 会 导致 压缩 比 下 
降 。 相 反 ， 较 粗 粒 度 的 量化 在 提高 压缩 Sa 六 会 导致 还 原 图 像 质 量 的 下 降 。JPEG 允许 用 
户 自 定义 量化 表 来 控制 压 缩 图 像 的 品质 _ 
3， 病 编码 用 于 消除 图 像 内 的 空间 完 余 度 ,次 
在 消除 图 像 内 的 空间 宛 余 度 技术 中 的 坟 编码 主 = 个 压缩 过 程 。 
首先 ， 对 于 8X8 像素 块 经 DCT 变换 和 量化 后 得 到 的 数据 , 在 8X8 块 的 左上 角 的 一 个 数 
en 它 代表 了 8X8 像素 块 的 习 灰 度 ， 是 64 个 采样 点 实际 值 的 平均 值 。 
JPEG 对 一 幅 站 这 系数 进行 编 到 时 将 整 幅 图 像 中 每 一 个 8X8 像素 块 ， 按 从 左 到 右 、 
从 上 到 下 顺序 ， 其 中 的 直流 系数 进行 空间 DPCM 编码 。 其 依据 是 : 在 自然 图 像 中 ， 图 像 
灰 度 变化 比较 平缓 ， 相 邻 直流 系数 的 数据 差别 一 般 不 大 ， 所 以 对 灰 度 信息 使 用 DPCM 方法 进 
行 编码 可 达到 较 好 的 压缩 效果 。 
其 次 ， 每 一 个 8X8 像素 块 中 其 余 的 63 个 系数 ， ts 代表 频率 信息 。 
交流 系数 表达 了 对 应 像素 的 亮度 信息 。 由 于 相 邻 像素 的 亮度 信息 具有 很 强 的 相关 性 ， 也 就 是 
说 ， 相 邻 的 若干 个 像素 出 现 相同 亮度 的 概率 比较 大 。 对 AC 9 Z 形 扫描 的 目的 就 是 要 
增加 连续 的 “0” 系 数 的 个 数 ， 即 增加 “0” 系 数 的 行程 长 度 。 经 过 Z 形 扫描 后 ， 就 将 一 个 8 
X8 的 矩阵 变 成 了 一 个 具有 64 个 数据 的 一 维 矢量 ， 同 时 ， ei 
集中 在 前 面 ， 对 图 像 重 构 影响 不 大 的 低频 系数 会 集中 在 后 面 。 经 量化 后 ， i 的 低频 系数 大 
多 为 “0”。 对 于 这 样 的 数据 序列 采用 行程 长 度 编码 方法 进行 编码 可 以 达到 较 训 4 压缩 比 。AC 
系数 的 Z 形 扫描 方法 如 图 4.11 所 示 。 
最 后 ,对 DPCM 编码 后 的 直流 系数 和 行程 长 度 编码 后 的 交流 系数 还 有 进一步 压缩 的 潜力 ， 
采用 烂 编码 中 的 哈 夫 曼 编 码 可 进一步 压缩 信息 量 。 使 用 哈 夫 曼 编码 的 原因 是 可 以 使 用 比较 简 
单 的 查 表 方 法 进行 编码 ， 压 缩 过 程 中 ， 对 高 概率 符号 分 配 较 短 的 编码 ， 对 低 概率 符号 分 配 较 
长 的 编码 , 而 这 种 变 长 编码 所 用 的 码 表 可 事先 进行 定义 ，JPEG 标准 中 给 出 了 建议 的 哈 夫 曼 编 
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一 ZE 拉 扩 和 到 的 数据 序列 一 
图 4.11 8X8 块 AC 系数 的 Z 形 扫描 






































经 过 3 步 压缩 后 ,JPEG 最 后 将 各 种 标记 代码 和 编码 后 的 图 人 自流 牢 组 成 数据 位 沪 ， 
于 保存 、 传 输 和 应 用 。 


4. IDCT 是 北 DCT 变换 
用 于 将 YUV 信号 变换 为 RGB 信号 ， 用 Na 出 。 
4.2.4 JPEG 2000 . RS 


JPEG 2000 是 由 ISO 的 JPEG 全 和 证 的， 正式 名 称 为 “ISO 15444”，1997 年 3 月 

始 筹划 ，1999 年 年 底 制 定 完成 。 JEEG 2 2000 与 JPEG 相 比 ， 可 得 到 更 高 的 压缩 比 ， 在 相同 
ee es JPEG 2000 在 200 倍 的 压缩 比 下 ， 仍 然 可 
以 得 到 不 错 的 显示 品质 ， 而 -JPEG 一 般 的 压缩 比 为 20~40. 不 管 是 对 与 数字 影像 相关 的 软件 
世人 而 训 ，JPEG 2000 技术 标准 的 站 


1. JPEG 2000 的 万 理 站 


JPEG 2000 与 传统 JPEG 最 大 的 不 同 ， 让 于 它 放 弃 了 JPEG 所 采用 的 以 离散 余弦 转换 
(Discrete Cosine Transform) 为 主 的 区 块 编码 方式 ， 而 改 用 以 小 波 转换 (Wavelet Transform) 为 主 
的 多 解析 编码 方式 . DCT 变换 方式 对 图 像 信息 中 的 频率 信息 进行 处 理 , 但 时 间 信 息 无 法 表达 。 
DCT 处 理 了 图 像 的 频率 分 辨 率 问 题 ， 但 不 知道 这 些 频率 什么 时 候 及 在 什么 地 方 出 现 ， 即 没有 
处 理 时 间 分 辨 率 的 问题 ， 同时 以 区 块 编码 方式 的 主要 缺点 是 将 自然 图 像 中 的 相关 性 人 为 地 割 
裂 开 来 ， 所 以 会 导致 图 像 还 原 时 出 现 块 与 块 之 间 的 “边界 效应 ”。 小 波 转换 将 一 幅 图 像 作为 
一 个 整体 进行 变换 和 编码 ， 很 好 地 保存 了 图 像 信息 中 的 相关 性 ， 达 到 了 更 好 的 压缩 编码 效果 ， 


如 图 4.12 所 示 。 
| ,wns 才 |_ | 阅 值 是 化 图 像 编码 
不 妈 淹 像 | 一 | 小波 变换 | | ( 旦 化 炭 ) | | 给。 训 


图 4.12 小 波 图 像 分 解 编码 过 程 
小 波 变换 是 一 种 函数 。 用 于 不 同 压缩 目的 的 小 波 函 数 常 以 开发 者 的 名 字 命 名 ， 如 Haar( 哈 
尔 ) 小 波 、Morlet 小 波 等 。 在 小 波 变换 中 ， 采 用 缩放 和 平移 的 方法 对 图 像 进 行 处 理 ， 经 过 小 波 
变换 处 理 的 图 像 ， 既 包含 了 频率 分 辨 率 的 信息 ， 也 包含 了 时 间 分 辩 率 的 信息 。 频 率 分 辨 率 可 
以 用 以 控制 编码 图 像 的 大 小 ， 时 间 分 辩 率 可 以 选择 对 图 像 的 哪 一 部 分 进行 压缩 。 这 样 ， 用 户 
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一 多 天 条 技术 大 鞭 应 用 (第 2 县 ) 
可 以 构造 出 从 最 大 (原始 图 像 ) 分 辩 率 到 极 小 分 辩 率 的 图 像 。 在 编码 过 程 中 , 小波 可 用 一 个 极 小 




















分 辩 率 的 图 像 加 上 图 像 细 节 值 进行 编码 ， 以 取得 高 压缩 比 。 同 时 ， 根 据 压 缩 数 据 解 压缩 时 ， 


只 要 选择 合适 的 量化 器 ， 就 可 以 还 原 出 符 
的 ， 也 可 以 是 有 失真 的 。 这 样 ， 用 户 可 对 
以 最 简单 的 小 波 








【 例 4.4】 一 幅 图 像 是 只 
Haar 变换 系数 。 
(1) 求 均值 : 将 像素 值 从 左 至 右 ， 两 个 一 组 求 均值 ， 得 到 {9 5}。 经 过 这 一 步 ， 图 像 分 辩 


率 从 1X4 变换 为 1X2， 从 而 得 到 一 个 大 小 为 1/2 低 分 辩 率 的 图 像 (若是 二 维 图 像 ， 贝 








合用 户 要 求 





4 有 4 个 像素 


个 分 辩 率 为 原 图 像 1/4 的 低 分 辩 率 图 像 )。 
(2) 求 差 值 : 求 均值 的 过 程 丢掉 了 一 些 信息 (细节 系数 )， 而 这 部 分 信息 正 是 还 原 图 像 时 所 
图 像 分 辩 率 缩小 而 造成 的 图 像 损 失 ， th 


需要 的 图 


系数 ， 并 
值 和 差 值 





像 细 节 。 要 弥补 因 








依次 写 入 均值 后 面 。 





中 。 方 法 是 从 左 向 右 ， 将 每 像素 对 中 的 第 一 


光一 维 图 像 ， 





TN 











平均 值 和 








像 16 的 低 分 辩 率 图 像 )。 


对 第 3 步 的 结果 采用 合适 的 量 


(3) 重复 1 和 2， 把 图 像 {9 5 2 一 二 进一步 
3 个 细节 值 。 分 辩 率 只 1 有 原始 图 


量化 过 程 主要 目的 是 将 一 a 


时 又 不 天 
对 于 





还 原 
二 维 图 像 的 小 波 


行 执行 求 均值 和 求 差 值 ， 人 


编码 。 末 


5， 也 就 是 把 [5 
从 图 4.13 可 以 看 出 原始 图 像 信息 








一 幅 原始 图 像 还 行 处 理 及 结果 
的 细节 值 量化 为 0。 
经 过 小 波 分 解 变换 后 ， 其 非 “0” 数 据 集中 在 两 个 位 置 ， 


图 像 的 质量 产 生 过 的 影响 。 
解 与 变换 也 可 以 分 为 3 


外 后 对 所 有 列 执 行 求 才 


图 像 中 感 兴趣 的 部 分 进行 分 别处 理 。 
变换 一 一 Haar 小 波 变换 为 例 , 观察 小 波 变 换 对 图 像 信息 的 分 解 与 压缩 过 程 。 


个 像素 值 城 去 它们 1 
求 差 值 过 程 的 结 IE 


wr 2 一 1}。 这样 原 图 像 被 分 解 为 一 个 
/4 洪 是 二 维 图 像 ， 则 得 到 一 个 分 辩 率 为 原 图 


a 与 DCT 中 的 量化 相似 ， 
较 作 ) 的 细节 量 可 洁 0， 以 便 取得 较 训 的 压缩 比 





的 图 像 质量 。 这 一 过 程 既 可 以 是 无 失真 





对 应 的 像素 值 为 {11 7 4 6}， 计 算 它 的 





得 到 一 














从 而 得 到 一 个 细节 
， 一 幅 图 像 经 一 次 求 均 





本 


MG 


bor 首先 将 像素 值 构成 的 矩阵 的 所 有 


求 差 值 ， 最 后 经 量化 器 量化 后 进行 小 波 


图 生 13 所 示 。 在 处 理 过 程 中 ， 量 化 器 中 准 值 取 值 为 





一 个 是 位 于 左上 角 的 一 个 值 ， 它 代表 了 整个 图 像 的 像素 平均 值 。 一 个 是 位 于 右 下 角 的 若干 个 








值 ， 它 人 





























代表 了 图 像 的 细节 系数 。 对 于 图 像 处 理 而 言 ， 去 掉 一 些 对 视觉 影响 不 大 的 “小 细节 ” 
( 即 绝 对 值 小 于 阔 值 的 细节 系数 )， 对 重 构图 像 质量 的 影响 不 大 ， 是 可 以 接受 的 
64 2 36160 6 7 57 32.5 0 0 0 0 0 0 0 
9 55 54 12 13 51 50 16 0 0 0 0 0 0 0 0 
17 47 46 20 21 43 42 24 0 0 0 0 0 0 0 0 
40 26 27 37 36 30 31 33 0 0 0 0 0 0 0 0 
32 34 35 29 28 38 39 25 有 ”有 = 
41 23 22 44 45 19 18 48 0 0 = $=7 0 
49 15 14 5253 11 10 56 0 0 0 0 0 et 11 
85859 54 6263 1 站 内: 有 = 
原 给 图 像 数据 一 个 波 分 名 这 换 。 。 基 化 后 的 数据 
图 4.13 “小波 变 换 前 后 数据 对 比 
阀 值 的 使 用 可 以 用 来 消除 图 像 中 的 噪声 ， 同 时 设置 不 同 大 小 的 阔 值 可 以 得 到 不 同 的 压缩 











第 4 章 有 
多 媒体 数据 压缩 技术 人 


。 阔 值 越 大 ， 压 缩 比 越 高 ， 同 时 图 像 质量 会 有 所 下 降 。 对 一 般 图 像 阔 值 设置 为 5 时 ， 重 构 
pe 质量 与 原始 图 像 肉眼 不 能 区 分 ; 当 阔 值 设置 为 10 时， 大 | 重 构图 像 的 质量 影响 不 大 。 

对 二 维 图 像 的 所 有 行进 行 一 次 求 均值 相当 于 在 水 平方 向 将 图 像 分 辩 率 降低 112。 对 二 维 图 
像 的 所 有 列 进行 一 次 求 均值 相当 于 在 垂直 方向 将 图 像 分 辨 率 降 低 1/2。 图 4.14 演示 了 一 幅 图 
像 经 过 3 次 小 波 分 解 变换 后 图 像 分 辩 率 变化 的 情况 。 


EF 150#160 





































































{b) 1/4 分 崎 率 图 碧 





(SV 友 分 半 率 图 像 (di NG4 分 准 举 图像 


图 4.14 小 波 分 解 产生 的 多 种 分 辩 率 图 像 
2.， JPEG 2000 的 优势 及 应 用 


JPEG 2000, 标 准 作为 JPEG 升级 版 ， 其 < 比 JPEG 高 约 30% 左 右 ; 同时 支持 有 损 压缩 
( 闪 值 非 0 和 无 损 压 缩 ( 闪 值 为 0)， 而 JPEG 较 常 用 的 压缩 方案 为 有 损 压 缩 ; 支持 所 谓 的 “ 感 兴 
趣 区 域 ” 特 性 ， 可 任意 指定 影像 上 感 兴趣 区 域 的 压缩 质量 ， 还 可 以 选择 指定 的 部 分 先 解压 缩 ， 
便于 突出 重点 。 JPEG 2000 可 以 实现 累进 式 传输 , 特别 适合 具有 QoS 要 求 的 网 络 传输 ; 图 4.15 
展示 了 低压 缩 比 下 JPEG 和 JPEG 2000 的 压缩 效果 。 
















JPEG 图 像 质 恒 85 
交尾 大 小 :25 472b 


JPEG2000 卡 巡 比 中 JPE a 红线 21 

六 件 大 小 : 24 3248 文件 大 小 :12 202b 

图 4.15 ”人 脸 压 缩 细节 效果 对 比 

高 压缩 比 下 ， 以 相同 的 压缩 率 压缩 后 的 图 像 细 节 放 大 对 比如 图 4.16 所 示 。 
JPEG 2000 和 JPEG 相 比 优势 明显 , 且 向 下 有 

在 图 像 的 网 络 传输 方面 具有 明显 的 优势 。 对 于 高 














可 能 取代 传统 的 JPEG 格式 .JPEG 2000 
i 量 的 图 像 ， 往 往 因 为 数据 量 较 大 ， 所 以 在 
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电线 下 区 媒体 找 坟 有 其 应 用 (第 及 ) 

网 络 上 传输 会 有 较 大 的 延迟 ， 利 用 JPEG 2000 对 图 像 进 
行 压缩 后 ， 可 大 幅度 降低 图 像 的 数据 量 。 因 此 ， 对 于 使 
用 PC、 笔 记 本 式 计算 机 、 便 携 式 计 算 机 或 PDA， 通 过 
Modem 接 入 Internet 访问 图 像 数 据 的 用 户 来 说 是 非常 必 
要 的 。 另 外 在 需要 进行 保密 或 抗 干 扰 要 求 比较 高 的 应 
(如 卫星 图 像 传输 等 ) 中 ,JPEG 2000 编码 器 特有 的 码 流 组 
织 形式 使 输出 码 流 具 有 有 效 抑制 误 码 的 能 力 。 这 样 ， 可 
以 大 幅度 降低 由 于 传输 误 码 而 造成 的 损失 。 可 以 预见 ， 
JPEG 2000 将 在 以 下 领域 得 到 广泛 的 应 用 : Internet、 移 
动 和 便携 设备 、 印 刷 、 扫 描 (出 版 物 预览 )、 数 码 照 相机 、 遥 感 、 传 真 (包括 彩色 传真 和 Internet 
传真 )、 医 学 应 用 、 数 字 图 书馆 和 电子 商务 等 。 


4.3 运动 图 像 压缩 标准 < RR 













































































图 4.16 JPEG 与 JPEG 2000 压缩 














图 像 的 细节 对 比 






































4.3.1 ”MPEG 系列 标准 和 A 


人 NS 

MPEG 系列 标准 是 由 ISO/IEC( 国 际 标准 人 1[ 纲 ) 国 际 电工 委员 会 ) 共 同 制定 的 。 MPEG 专 
家 组 始 建 于 1988 年 ， 专门 负责 为 运动 图 像 建 这 1 频 和 音频 标准 ， 以 适用 于 配合 不 同 带 宽 和 数 
字 影 像 质量 的 要 求 。 现 有 3 个 版 本 :、 MPEGT MPEG-2 及 MPEG-4(MPEG-3 标准 制定 后 因 与 
MPEG-2 的 部 分 内 容 相近 , 故 很 快 被 废止 )。 如 果 说 MPEG:1 “文件 小 ， 但 质量 差 ”, 而 MPEG-2 
“质量 好 ， 但 更 占 空间 ” 的 话 姥 么 MPEG-4 则 很 好 地 结合 子 前 两 者 的 优点 。 它 于 1998 年 10 
月 定案 , 在 1999 年 1 月 成 为 国际 标准 ， 随后 为 扩展 用 途 又 进行 了 第 二 版 的 开发 ， 目 前 标准 的 
扩充 仍 在 继续 。 继 MPEG-4 之 后 ， 为 解决 快速 增长 的 多 媒体 信息 的 管理 和 快速 检索 ，MPEG 
又 提出 了 解决 方案 MPEG-7。 该 工作 于 1958 年 提出 ， 已 在 2001 年 底 基本 完成 。 

MPEG 系列 标准 作为 运动 图 像 压缩 编码 国际 标准 具有 很 好 的 兼容 性 和 较 高 的 压缩 比 (最 
高 可 达 200 : 1D)。 而 且 数据 的 损失 小 。MPEG-1 和 MPEG-2 的 成 功 推出 和 应 用 成 为 推动 新 的 电 
子 消费 市 场 的 动力 ， 如 Video CD、 数 字 电视 、DVD 和 DBS(Direct Broadcasting Satellite， 卫 
星 直播 系统 )。MPEG-4 则 提供 了 基于 对 象 的 多 媒体 解决 方案 。 随 着 MPEG 新 标准 的 推出 ， 数 
据 压缩 编码 、 传 输 技术 和 基于 内 容 的 多 媒体 信息 检索 等 技术 将 趋向 更 加 规范 化 和 实用 化 。 本 
节 将 介绍 有 关 MPEG 系列 标准 中 的 基本 内 容 。 


4.3.2 ”MPEG-1 标准 中 的 主要 技术 及 压缩 过 程 


MPEG-1 标准 公布 于 1992 年 。 MPEG-! 是 按 工业 级 标准 而 设计 并 可 用 于 不 同 带 宽 的 设备 ， 
如 CD-ROM、Video-CD、CD-I 等 , 它 还 对 SIF 标准 分 辨 率 (对 于 NTSC 制 为 352X240; 对 PAL 
制 为 352X288) 的 图 像 进 行 压缩 ， 传 输 速 率 为 1.5Mb/s， 每 秒 播放 30 帧 ， 具 有 CD 音质 ， 质 量 
级 别 基本 与 VHS 相当 。MPEG-1 的 编码 速率 最 高 可 达 4~5Mb/s, 但 随 着 速率 的 提高 ， 其 解码 
后 的 图 像 质 量 有 所 降低 。MPEG-1 也 被 用 于 数字 电话 网 络 上 的 视频 传输 ， 如 非 对 称 数 字 用 户 
线路 (ADSL)、 视 频 点 播 (VOD) 及 教育 网 络 等 。 同 时 ，MPEG-1 也 可 用 于 多 媒体 信息 的 存储 和 
Internet 音频 的 传输 。 
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1. MPEG-l 标准 系统 结构 


MPEG-!1 标准 体系 共 分 为 5 个 部 分 。 

第 一 部 分 ISO/TEC 11172-1: 系统 ): 用 于 将 一 个 或 多 个 MPEG-l 标准 的 视频 音频 流 进 行 合 
并 ， 并 同步 成 为 一 个 数据 流 ， 以 便于 进行 数字 化 存储 和 传输 。 

第 二 部 分 ISO/EC 11172-2: 视频 ): 定义 了 视频 压缩 编码 的 表示 方法 ， 比 特 率 大 约 为 
1.5Mb/s。 

第 三 部 分 (ISO/IEC 11172-3: 音频 ): 定义 了 音频 ( 单 声 道 或 多 声 道 ) 压 缩编 码 表示 方法 。 
技术 核心 是 子 带 编码 和 心理 声学 模型 。 音 频 采样 输入 编码 器 映射 后 ， 产 生 了 经 过 过 滤 和 子 提 
样 的 输入 音频 流 ， 心 理 声学 模型 根据 输入 音频 产生 相应 的 参数 ， 用 于 控制 量化 和 编码 。 量 化 及 
编码 部 分 根据 映射 后 的 样本 产生 编码 标记 。 经 打包 将 数据 流 输 出 。 音 频 编码 器 的 结构 如 图 4.17 
所 示 。 . 
























































图 4.17 MPEGH1 音频 编码 的 基本 结构 
第 四 部 分 (SOAEC 11172-4: 统 相 站 测 ): 介绍 设计 检测 年 段 玉 证 明 比特 流 和 解 外 器 是 否 
能 满足 MPEG-! 标准 中 前 3 部 分 要 求 的 方法 。 编 码 器 制造 商 和 客户 均 可 使 用 这 些 方法 来 验证 
编码 器 产生 的 码 流 是 否 正 确 。_ \ 人 
第 五 部 分 (ISO/TEC,11172-5: 软件 模型 ):> 从 技术 土 讲 ， 这 部 分 不 算 标准 ， 只 是 一 种 技术 报 
告 ， 描 述 了 pele 源 代码 是 不 公开 的 。 
2，MPEG-0) 审 的 关键 技术 


MPEG-1 编码 过 程 中 既 要 考虑 消除 一 帧 图 像 内 部 的 数据 元 余 ， 又 要 考虑 消除 存在 于 帧 与 
帧 之 间 的 数据 元 余 。 对 于 视频 来 说 ， 视 频 中 的 一 帧 可 看 作 一 幅 静 态 图 像 ， 所 以 可 以 用 静态 图 
像 的 压缩 方法 来 消除 数据 元 余 。 而 在 连续 的 相 邻 两 帧 甚至 多 帧 之 间 会 有 相当 大 的 数据 宛 余 。 
以 电视 信号 为 例 ， 每 秒 电 视 要 播放 (刷新 )25 帧 图 像 以 保持 视频 的 稳定 。 除 镜头 切换 等 特殊 情 
况 外 ， 绝 大 多 数 情况 下 ,在 1/25s 时 间 间 隔 中 的 两 帧 图 像 ， 会 存在 绝 大 多 数 的 相同 点 。 这 样 在 
帧 与 帧 之 间 ， 可 以 通过 运动 估计 和 运动 补偿 等 方法 来 消除 时 间 元 余 度 导致 的 数据 元 余 。 

MPEG-1 标准 在 编码 开始 时 ， 首 先 要 对 视频 源 的 图 像 序列 进行 分 组 。 通 常 以 10 或 15 帧 
图 像 为 一 组 开始 其 压缩 过 程 。 按 照 标准 的 规定 ，MPEG-1 视频 帧 率 为 30 帧 /s， 一 般 情况 下 ， 
在 1/2 可 1/3s 内 ， 视 频 镜头 切换 的 几率 比较 小 ， 换 而 言 之 ， 在 这 个 期 间 ， 视 频 信息 中 数据 宛 
余 量 很 大 ， 即 使 存在 镜头 切换 ， 在 下 一 个 在 1/2 可 1/3s 内 再 进行 处 理 也 不 会 对 视觉 造成 大 的 
影响 。 这 样 ， 经 分 组 后 ， 对 于 每 组 图 像 就 可 以 进行 分 类 处 理 。MPEG-1 对 于 一 组 图 像 只 对 少 
量 的 图 按照 JPEG 方式 进行 压缩 编码 ， 以 消除 帧 内 存在 的 空间 宛 余 度 ， 对 其 他 的 大 部 分 图 像 
则 进行 以 运动 估计 和 运动 补偿 为 主要 压缩 算法 的 预测 编码 。 这 样 可 以 在 当时 技术 条 件 下 ， 最 
大 限度 地 压缩 编码 数据 。 图 4.18 描述 了 MPEG-1 标准 中 使 用 的 编码 帧 及 其 分 块 结构 。 在 图 中 ， 
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和 
Yi 
应 第 之 矿 ) 
描述 了 对 一 幅 图 像 进行 内 部 划分 的 情况 .其 中 切片 是 对 一 幅 图 像 按 行 (每 行 包含 8 列 像素 ) 的 划 
分 ， 其 目的 是 为 了 进一步 详细 地 划分 图 像 。 宏 块 用 于 消除 帧 间 数 据 宛 余 的 运动 估计 和 补偿 算 
法 。 块 用 于 消除 帧 内 数据 宛 余 的 JPEG 压缩 编码 算法 。 
图 像 序列 
图 4.18 MPEG-1 帧 结构 。 从 
在 MPEG-1 标准 中 ， 用 于 帧 内 压缩 编码 的 主要 技术 有 以 下放 种 。 
1) 基于 8X8 像素 块 的 离散 余弦 变换 DCT > 
DCT 不 直接 对 图 像 产生 压缩 作用 ， 但 对 图 像 的 能 量具 有 很 好 的 集中 效果 ， 为 压缩 打下 了 
基础 。 YN 


2) 量化 器 


量化 过 程 是 指 以 某 个 量化 阔 值 去 除 ， 


化 步 长 越 小 量化 精度 就 越 细 


,XX 


WDCT 系数 并 取 整 。 量化 步 长 的 大 小 称 为 量化 精度 ， 量 
息 越 多 ， 但 所 需 的 编码 数据 越 多 。 不 同 的 DCT 变换 








系数 对 人 类 视觉 感应 的 重要 性 是 不 同 的 因此 编码 器 根据 视觉 感应 准则 , 对 一 个 8X8 的 DCT 
变换 块 中 的 64 个 DCT 变换 系数 采用 不 同 的 量化 精度 以 保证 尽 可 能 多 地 包含 特定 的 DCT 空 


间 频 率 信息 ， 又 使 量化 精度 不 超过 需要 。DCT 变换 系数 中 ， 低 频 系数 对 视觉 感应 的 
高 ， 因 此 分 配 的 量化 精度 较 细 ; 





lL E 要 性 较 
高 频 系 数 对 视觉 感应 的 重要 性 较 低 ， 分 配 的 量化 精度 较 粗 ， 


通常 情况 下 ， 信 个 DCT 变换 块 中 的 大 多 数 高 频 系 数量 化 后 都 会 变 为 零 。 


3) Z 形 扫描 与 行程 长 度 编 


DCT 变换 产生 一 个 8X8 





码 
的 二 维 数组 ， 为 进行 传输 ， 还 须 将 其 转换 为 一 维 排列 方式 。Z 形 

















扫描 (Zig-Zag) 是 较 常 用 的 一 利 
零 DCT 系数 集中 





bh 于 8X8 二 维 


将 二 维 数组 转换 成 一 维 数组 的 方法 。 由 于 经 量化 后 ， 大 多 数 非 
和 矩阵 的 左上 角 ， 即 低频 分 量 区 。2Z 形 扫 描 后 ， 这 些 非 零 DCT 系 











数 就 集 





Z 形 扫描 的 优点 体现 出 来 了 ， 
系数 都 为 零 时 ， 只 要 用 一 个 “ 























产生 的 压缩 效果 非常 明显 。 
4) 灶 编 码 
量化 仅 和 4 


输 的 数字 上 





P 于 一 维 排列 数组 的 前 
编码 创造 了 条 件 。 行 程 长 度 编码 中 ， 
成 : 前 一 部 分 表示 连续 非 零 系 


E 成 了 DCT 系数 的 离散 表示 ， 实 际 传输 前 ， 还 须 对 其 进行 压缩 编码 ， 产 站 
特 流 。 焙 编码 是 基于 编码 信号 统计 特性 的 优秀 的 压缩 编码 方法 。 在 视频 压缩 编码 





部 ,后 面 跟着 长 串 的 量化 为 零 的 DCT 系数， 这些 就 为 行程 长 度 
只 有 非 零 系数 被 编码 。 一 个 非 零 系 数 的 编码 由 两 部 分 组 
数 的 数量 ( 称 为 行程 长 度 )， 后 一 部 分 是 那个 非 零 系数 。 这 样 就 把 
行程 长 度 编码 的 效率 比较 高 。 当 一 维 序列 中 的 后 部 剩余 的 DCT 
' 块 结束 ”标志 (EOB) 指 示 ， 就 可 结束 这 一 8X8 变换 块 的 编码 ， 





























于 传 























技术 中 使 用 很 广 ， 











主要 
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于 帧 内 的 空间 元 余 度 的 消除 。 哈 夫 曼 编码 是 炳 编码 中 的 杰出 
哈 夫 曼 编码 在 确定 了 所 有 编码 信号 的 概率 后 生产 一 个 码 表 ， 对 大 概率 信号 分 配 较 少 


代表 。 
比特 表 











] 





一 


示 ， 对 小 概率 信号 分 配 较 多 的 比特 表示 ， 使 得 平均 码 长 趋 于 最 短 。 
5) 信道 缓存 
于 采用 了 灶 编 码 ， 产 生 的 比特 流 的 速率 是 变化 的 ， 随 着 视频 图 像 的 统计 特性 变化 。 但 
大 多 数 情 况 下 传输 系统 分 配 的 频带 都 是 恒定 的 ， 因 此 在 编码 比特 流 进入 信道 前 需 设置 信道 绥 
存 。 信 道 缓 存 以 变 比特 率 从 灶 编 码 器 接收 数据 ， 以 传输 系统 标定 的 恒定 比特 率 向 外 读 出 ， 送 
入 信道 。 并 通过 反馈 控制 压缩 算法 ， 调 整编 码 器 的 比特 率 ， 使 得 缓存 器 的 写 入 数据 速率 与 读 
出 数据 速率 趋 于 平衡 。 使 得 缓存 既 不 上 溢 也 不 下 滋 。 

为 了 解决 帧 间 的 数据 宛 余 压 缩 问 题 ，MPEG-1 对 视频 编码 时 ， 将 编码 图 像 被 分 为 3 类 ， 
分 别称 为 1 图 ( 帧 内 图 )、P 图 (预测 图 ) 和 B 图 ( 插 补 图 )。MPEG-1 视频 图 像 序列 中 I、P、B3 类 
图 像 的 分 布 情况 如 图 4.19 所 示 。 
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图 像 组 ] WS 图 像 组 | 
图 4.19 wkd Hina 


图 4.19 中 , I 图 图 像 采用 帧 内 2 即 只 利用 了 单 帧 图 像 内 的 空间 相关 性 进行 压缩 。 
压缩 技术 核心 为 JPEG 压缩 算法 。 ne 
如 定格 、 快 进 、 快 退 等 VCR 操作 。1 图 图 像 的 压缩 比 相 对 较 低 ， 同时 也 是 P 图 和 B 图 产生 的 
依据 ， 所 以 1 图 质量 好 坏 放 接 影 响 整个 MPEG-! 视频 六 的 还 原 质量 。1 图 是 周期 性 出 现在 图 像 
序列 中 的 ， 出 现 频率 可 由 编码 器 选择 。 于 -> 

P 图 由 最 个 了 国 吕 图 通过 人 外 计 (用 向 六 所 以 可 以 有 
较 大 的 压缩 比 ， 因 为 P 图 是 经 过 预测 编码 产生 的 ， 所 以 必然 存在 着 一 些 预测 误差 ， 而 
且 P 图 可 以 作为 下 一 个 P 图 产生 的 依据 ， 所 以 使 用 P 图 会 引起 误差 的 传递 和 扩大 。 
B 图 既 可 以 使 用 前 一 图 像 (1 图 或 P 图 )、 又 可 以 使 用 后 一 图 像 (I 图 或 P 图 )、 或 使 用 前 后 两 
个 图 像 ([ 图 或 P 图 ) 预 测 编码 的 图 像 。B 图 提供 了 最 大 程度 的 压缩 效果 ， 并 且 不 会 产生 误差 传 
递 。 双 向 预测 是 两 个 图 像 的 平均 ， 它 可 根据 前 面 或 后 面 图 的 信息 进行 双向 插 补 ， 从 而 调节 画 
面 的 质量 。 增 加 B 图 的 数目 ， 能 提高 压缩 比 ， 但 视频 质量 会 有 损失 。 所 以 在 MPEG-1 中 ， 人 多 
许 用 户 根据 压缩 视频 画面 的 复杂 程度 和 还 原 视 频 的 质量 要 求 来 综合 考虑 决定 I_P、B 3 类 医 
像 之 间 的 时 间 间 隔 。 典 型 的 MPEG-1 视频 图 像 序列 安排 如 图 4.20 所 示 。 

| 0.5s | 
“IBBPBBPBBPBBPBBI-:. 


































































































































































































图 4.20 典型 的 MPEG-1 视频 图 像 序列 
所 以 P 帧 和 B 帧 图 像 采 用 帧 间 编 码 方式 ， 即 同时 利用 了 空间 和 时 间 上 的 相关 性 ， 可 以 提 
高 压缩 效率 。MPEG-1 用 以 帧 间 压 缩编 码 的 主要 技术 有 以 下 几 种 。 
1) 运动 估计 
运动 估计 是 指 利用 相 邻 帧 之 间 的 相关 性 ， 对 于 当前 目标 图 像 中 的 某 一 宏 块 (best match)， 
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一 多 若 你 找 林 及 站 应 用 (第 二 县 ) 




















一 在 参考 图 像 中 寻找 与 之 最 相似 的 宏 块 ， 然 后 对 它们 的 差 值 进行 编码 。 运 动 估计 用 于 消除 帧 间 





的 时 间 宛 余 度 ， 估 计 的 准确 程度 直接 影响 帧 间 编 码 的 压缩 效果 。 运动 估计 以 宏 块 (16X16 像素 
块 ) 为 单位 进行 ， 计 算 被 压缩 图 像 与 参考 图 像 的 对 应 位 置 上 的 宏 块 间 的 位 置 偏 移 。 并 以 相应 的 
运动 矢量 来 描述 ， 一 个 运动 矢量 代表 水 平和 垂直 两 个 方向 上 的 位 移 。 运 动 估计 的 本 质 是 预测 
编码 ， 用 于 运动 估计 的 基本 算法 如 下 。 
向 前 预测 : 五 (X) = 五 (和 十 mo) 
向 后 预测 : 五 (X) 三 五 (X+m) 
双向 预测 : 工 (X)=[,(X+mvo)+ D(X+mv,)]/2 
其 中 ， 预 测 误差 为 厂 (X) 一 (XX) ; XX 为 像素 坐标 ，mv, 为 宏 块 相对 于 参考 图 万 的 运动 矢量 
mm 为 宏 块 相对 于 参考 图 妃 的 运动 矢量 。 
运动 估计 时 ，P 帧 和 B 帧 图 像 所 使 用 的 参考 帧 图 像 是 不 同 的 * 了 帧 图 像 使 用 前 面 最 近 解 
码 的 工 帧 或 P 帧 作为 参考 图 像 ， 称 为 前 向 预测 ， 而 B 帧 图 、 像 作为 预测 参考 ， 称 
为 双向 预测 , 其 中 一 2 一 帧 在 显示 顺序 上 晚 于 
编码 帧 /后 向 预测 )，B 帧 的 参考 帧 在 任何 情况 下 都 是 了 祸 或 了 帧 。 上 述 算法 可 用 差分 编码 ( 妈 
EAs 除了 物体 边缘 外 ， 
其 他 部 分 差别 都 很 小 ， 所 以 可 进 一 数据 。 
2) 运动 补偿 
RO 
位 置 ， er 在 绝 大 多 数 的 自然 场 录 中 运动 都 是 有 序 的 。 因 此 ， 这 
种 运动 补偿 生成 的 预测 图 像 与 被 压缩 图 像 的 差分 值 是 很 小 的 ， 可 以 最 大 限度 上 压缩 数据 。 
MPEG-1 标准 公布 后 ， ee 尤其 是 VCD 数字 视频 系统 ， 
可 谓 是 风靡 一 时 ， ,而 和 EG-1 标准 中 的 音 和 码 技术 也 为 我 们 提供 了 优美 动听 的 MP3 技术 。 


43.3 MPEG- Ne MPEG-1 的 改进 六 


MPEG-2 标 准 于 1994 年 由 ISO/IEC 制定 公布 ,是 多 媒体 视频 压缩 技术 中 的 又 一 重要 标准 。 
MPEG-2 在 MPEG-1 基础 上 ， 对 音频 、 视 频 、 码 流 合成 、 音 视频 控制 等 方面 进行 了 大 量 的 扩 
充 ， 同 时 保持 了 向 下 兼容 。 


1. MPEG-2 标准 的 体系 结构 


MPEG-2 标准 目前 分 为 9 个 部 分 , 统称 为 ISO/IEC 13818 国际 标准 。 各 部 分 的 内 容 简 单 描 
述 如 下 。 

第 一 部 分 (ISO/IEC 13818-1，System 一 一 系统 ): 描述 多 个 视频 、 音 频 和 数据 基本 码 流 合成 
传送 流 和 程序 流 的 方式 。 图 4.21 给 出 了 MPEG-2 的 编码 系统 模型 。 

程序 流 与 MPEG-! 中 的 系统 复合 流 相 似 。 它 由 一 个 或 多 个 同一 时 刻 的 PES(Packetized 
Elementary Stream， 打 包 的 基本 流 ) 合 成 一 个 流 。 程 序 流 一 般 用 在 错误 相对 较 少 的 环境 下 ， 适 
于 包含 软件 处 理 的 应 用 中 。 程 序 流 的 长 度 是 可 变 的 ， 而 且 可 以 相对 较 长 。 传 送 流 是 将 一 个 
或 多 个 不 同时 刻 的 PES 合成 到 一 个 流 中 。 传 送 流 适 用 于 可 能 出 错 的 环境 下 ， 如 在 有 丢失 或 噪 
声 的 媒体 中 传输 或 存储 中 。 传 送 流 包 的 长 度 固定 为 188 字 节 。 
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视频 数据 视频 PES 











视频 编 偶 状 


程序 流 


音频 数据 


传送 流 


非 餐 拉 莹 洒 本 


图 4.21 MPEG-2 系统 模型 


;二 部 分 (ISO/IEC 13818-2，Video 一 一 视频 ): 描述 视频 编码 方法 。 MPEG-2 在 MPEG-1 

标准 视频 压缩 能 力 的 基础 上 ， 新 增加 了 大 量 的 编码 工具 。 《SA 

第 三 部 分 (ISO/IEC 13818-3，Audio 一 一 音频 ): WASPEG 1 音频 标准 向 下 兼容 的 音频 
编码 方法 。 

第 四 部 分 (ISO/IEC 13818-4， Complianee 一 - 符 
MPEG-2 码 流 的 方法 。 / 

第 五 部 分 (ISO/IEC 13818-5， Sofh 
分 的 软件 实现 方法 。 x 

第 六 部 分 (ISO/IEC 13818-6) DSM: Cc——pigital gro Maia Command and Control， 数 
字 存 储 媒体 命令 与 控制 ):， .描述 交互 式 多 媒体 网 络 中 服务 器 与 用 上 ! 间 的 会 话 指 令 集 。DSM-CC 
定义 了 -个 称 为 会 议 及 资源 管理 器 (SRM) 的 逻辑 部 分 它 提 供 一 个 逻辑 上 集中 的 对 DSM-CC 

会 议 及 资源 的 管理 人 一 

以 上 6 个 部 分 在 对 # 电 视 、 DVD 技术 等 领 碟 得 到 了 广泛 应 用 。 此 外 ，MPEG-2 标准 中 的 
第 七 部 分 规定 了 不 百 MPEG-1 音频 向 下 兼容 的 多 通道 音频 编码 ， 第 八 部 分 现 已 停止 ， 第 九 部 
分 规定 了 传送 码 流 的 实时 接口 。 这 里 不 予 详 述 。 

2. MPEG-2 的 框架 与 级 


MPEG-2 视频 编码 标准 (ISO/IEC 13818) 是 一 个 分 等 
级 的 系列 ， 按 编码 图 像 的 分 辩 率 分 成 4 个 “级 ”(Levels); 
按 所 使 用 的 编码 工具 的 集合 分 成 5 个 “框架 ”(Profiles)。 
“级 ”与 “框架 ”的 若干 组 合 构 成 MPEG-2 视频 编码 标准 
在 某 种 特定 应 用 下 的 子 集 : 对 某 一 输入 格式 的 图 像 ， 采 
待定 集合 的 压缩 编码 工具 ， 产 生 规定 速率 范围 内 的 编 
码 码 流 ， 称 为 MPEG-2 适用 点 。MPEG-2 中 的 框架 划分 
如 图 4.22 所 示 。 

说 明 : 每 一 个 框架 可 在 一 定 的 应 用 范围 内 支持 多 组 
相应 的 应 用 特征 。 

(1) SP(Simple Profile, 简单 框架 ): 低 延 迟 视频 会 议 





Wd 描述 测试 一 个 编码 码 流 是 否 符合 





Cn 描述 了 MPEG-2 标准 的 第 一 、 二 、 三 部 























































































































4.22 MPEG-2 的 框架 
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本 多 媒体 技 


(3) SNRP(SNR 
(4) SSP(Spatiall 


(5) HP(High Profile, 


在 MPEG-2 的 
图 像 进行 更 精细 的 














(2) MP(Main Profile， 主 框架 ): MPEG-2 的 核心 部 分 ， 普 通 应 


处 理 ， 在 相同 比特 率 下 将 得 到 较 好 的 图 


术 及 其 应 用 (第 2 版 ) 














(如 DVD)。 





Profile， 信 噪 比 可 分 级 框架 ): 多 级 视频 质量 。 

y Scaleable Profile， 空 间 可 分 级 框架 ): 多 级 质量 及 方案 ; 

高 级 框架 ): 多 级 质量 、 规 定 和 色 度 格式 。 

5 个 “框架 ”中 ， 较 高 的 “框架 ”意味 着 采用 较 多 的 编码 工具 集 ， 对 编码 
像 质量 ， 当 然 实 现 的 代价 也 较 大 。 






































较 高 框架 编码 除 使 
较 高 框架 的 解码 器 
像 ， 即 MPEG-2 的 








除 能 解码 用 


较 低 框架 的 编码 工具 外 ,还 使 用 了 一 些 较 低 框架 没有 的 附加 工具 ， 因 上 
本 框架 方法 编码 的 图 像 外 ， 也 能 解码 用 较 低 框架 方法 编码 的 
“框架 ”之 间 具 有 向 下 兼容 性 。 关 于 框架 与 级 的 分 类 情况 见 表 4-4。 


表 4-4 MPEG-2 的 框架 与 级 























| 
























































框架 VA 
级 简单 框架 主 框架 空间 可 分 级 框架 | 。 高 级 框架 
4:2:0 4:2:0 4:2:0 .NN \ 4:2:0 4:2:0 或 4:2:2 

高 级 BO ) 100 Mb/s for 3 
1920X 1152 layers 
高 级 -1440 EO 60 Mb/s for 3 80 Mb/s for 3 
1440X1152 layers layers 
主 级 A 20 Mb/s for 3 
720X480 2 layers 
低级 六 
352X288 

目前 ， 标准 数字 所 视 和 和 DVD 条 是 、 MP@ML( 主 框架 和 主 级 )， 而 HDTV 采用 的 

是 MP@HL( 主 框架 和 高 级 )。 


MPEG-2 中 编码 图 像 仍 被 分 为 3 类 ， 和 和 庆 为 1 由 P 帧 和 了 B 帧 。 其 产生 方式 与 MPEG-1 


中 的 方式 相同 。 


4.3.4 MPEG-4 标准 上 


1999 年 1 月 ，MPEG-4 正式 成 为 国际 标准 ， 
半 透 明 


加 了 可 变形 、 
即 兼容 较 低 的 版 本 。 


从 轮廓 一 一 纹理 的 思 


在 完成 从 基于 像素 


像 编 码 ， 必 将 对 未 来 
MPEG-4 标 ; 





不 同 之 处 在 于 MPEG-2 中 工 帧 的 出 现 频率 和 图 像 分 辨 率 在 不 同 的 框架 和 级 中 
可 调节 度 更 大 ， 编 在 


马 方式 更 加 灵活 多 样 。 
hb 的 新 技术 





并 在 2000 年 推出 了 MPEG-4 Version 2.0， 增 
以 进一步 提高 编码 效率 ， 所 有 版 本 都 是 向 下 兼容 的 ， 
MPEG-4 视频 编码 技术 采用 了 现代 图 像 编码 方法 ， 利 用 人 了 眼 视觉 特性 ， 
路 出 发 ， 支 持 基于 内 容 和 对 象 的 编码 与 交互 功能 。MPEG-4 视频 编码 了 
的 传统 编码 向 基于 对 象 和 内 容 的 现代 编码 的 转变 ， 它 代表 了 新 - 代 智能 图 
像 通信 机 制 产生 深远 的 影响 。 

售 的 体系 结构 





视频 对 象 和 工具 ， 















































oy 











MPEG-4 标准 


下 面 5 部 分 组 成 。 











第 一 部 分 : DMIF(The Delivery Multimedia Integration Framework， 多 媒体 传送 整体 框架 ) 





DMIF 了 
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E 要 解决 交互 网 络 、 广 播 环境 及 磁盘 应 














中 多 媒体 信息 的 操作 问题 。 通 过 传输 多 路 合 





成 比特 信 


| 四 
息 来 建立 客户 和 服务 器 之 间 的 交互 和 传输 。 通 过 DMIF, MPEG-4 可 以 建立 起 具有 服 














务 质量 (Quality of Service，QoS) 保 证 的 通道 和 面向 每 个 基本 流 的 带宽 。 DMIF 整体 框架 主要 包 
括 3 方面 的 技术 , 交互 式 网 络 技术 (Internet、ATM 等 ), 广播 技术 (电视 .卫星 等 ) 和 磁盘 技术 (CD、 
DVD 等 )。 

第 二 部 分 : 缓冲 区 管理 和 实时 识别 。MPEG-4 定义 了 一 个 系统 解码 模型 (SDMDJ)， 该 解码 模 
型 描述 了 理想 情况 下 解码 比特 流 的 句法 语义 ， 它 要 求 特殊 的 缓冲 区 和 实时 处 理 模 式 。 通 过 有 





效 的 管理 ， 可 以 更 好 地 利用 有 限 的 缓冲 区 空间 。 

第 三 
部 分 将 音 
第 四 部 分 ， 视 频 编码。 与 音频 编码 类 似 ，MPEG-4 也 支持 对 自然 和 合成 的 视觉 对 象 的 编 
码 。 合 成 的 视觉 对 象 包括 2D、3D 动画 和 人 面部 表情 动画 等 。 
第 五 部 分 : 场景 描述 。MPEG-4 提供 了 一 系列 工具 ， 用 于 描述 组 成 场景 中 的 一 组 对 象 。 














scene description) 表 示 ，BIFS 与 AV 对 象 一 同 传输 、 编 码 。 场景 描述 主要 用 于 描述 各 AV 对 象 

















部 分 : 音频 编码 。MPEG-4 不 仅 支持 自然 声音 ， 而 且 支 持 合成 声音 。MPEG-4 的 音频 
频 的 合成 编码 和 自然 声音 的 编码 相 结 合 ， 并 支持 音频 的 对 象 特征 。 

















合成 场景 的 描述 信息 ， 就 是 场景 描述 。 场 景 描 描述 以 二 进 制 糙 式 BIFS(binary format for 














在 一 具体 AV 场景 坐标 下 ， 如 何 组 织 与 同步 等 问题 。 同时 迹 有 IAV 对 象 与 与 AV 场景 的 知识 产权 


保护 等 问 





根据 对 象 及 场景 描述 重建 





题 。MPEG-4 为 我 们 提供 了 丰富 的 AV 二 惟 图 4.23 描述 了 一 个 MPEG-4 视频 终端 
-个 场景 的 例子 。 、 














5 sil d 
eng 
组 成 和 消 痕 





Hiaaichical Intaractive, 
; Audiovisul Scene 
分 屎 ， 交 吾 ， 
视听 场 络 


油 些 至 
4 


局 omposition 
Intormation 


组 成 信息 

上 行 数据 流 
和 (User Events, Class Reques ,..} 

人 (了 用户 事 件 。 委 请 求 ，…) 


i 
和 Upstream Dam 















图 4.23 ”MPEG-4 接收 端 模型 


2. MPEG-4 视频 编码 功能 与 特点 
MPEG-4 为 支持 众多 的 多 媒体 应 用 ， 不 仅 保留 了 现 有 MPEG 标准 中 的 解决 方案 ， 而 且 开 
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第 4 章 .有 . 


使 得 交互 式 视频 游戏 、 实 时 


多 媒体 应 用 、 远 程 视频 监控 等 成 为 现实 。 


部 与 身体 活动 


码 ; 




















MPEG-4 的 视频 编码 部 分 提 














下 多 媒体 找 坟 及 黄 应 用 (第 之 服 ) 
一 发 了 众多 面向 对 象 和 基于 内 容 的 视频 编码 、 传 输 、 存 取 、 交 互 等 新 功能 。 这 些 功能 的 应 有 
可 视 通信 、 交 互 式 存储 媒体 应 用 、 虚 拟 会 议 、 多 媒体 邮件 、 移 动 

















供 的 算法 和 工具 ， 可 实现 下 列 功能 。 





(1) 图 像 和 视频 的 有 效 压 缩 。 


(2) 2D 和 3D 网 格 纹理 映射 





(用 于 合成 图 像 编 码 ) 的 有 效 压 缩 。 


(3) 隐 含 的 2D 网 格 的 有 效 压缩 。 
(4) 控制 网 格 运动 的 数据 流 的 有 效 压缩 。 

(5) 对 各 种 视频 对 象 的 有 效 存 取 。 

(6) 对 图 像 和 视频 序列 的 扩展 操纵 。 

(7) 基于 内 容 的 图 像 和 视频 编码 。 
(8) 纹理 、 图 像 和 视频 基于 内 容 的 伸缩 性 。 ,人 
(9) 视频 序列 中 时 域 、 空 间 及 质量 的 伸缩 性 。 < 








(10) 易 错 环境 下 的 稳健 性 。 


上 述 功能 大 部 人 与 基于 内 容 的 创作 、 发 布 和 存 也有 习 


MPEG-4 支持 合成 视频 对 象 











支持 视点 有 关 应 用 (View De 








技术 。 MPEG-4 可 对 从 成 的 面部 与 人 体 进行 参数 化 描述 : 对 面 





参数 化 的 数据 流 进行 描述 : 支持 具有 纹理 映射 功能 的 静态 /动态 网 格 编 














pendentApplication) 中 的 纹理 编码 。 使 用 户 根据 制作 者 设计 的 





具体 自由 度 ， 与 场景 进行 交互 。 用 户 不 仅 可 以 改变 场景 的 视角 ， 还 可 以 改变 场景 中 物体 的 位 
大 小 和 形状 ， 或 对 该 对 象 进行 四 换 甚至 消除。 用 雇 将 居 这 些 简便 灵活 的 交互 过 程 中 
-一 


置 、 


缩 的 目的 。 


像 信息 传输 的 








得 的 丰富 的 信息 和 极 大 的 乐 如。 


3， 从 短 形 帧 到 VOP 


传统 图 像 编 码 方法 依据 信 源 编码 理论 ， 将 图 像 作为 随机 信号 ， 利用 其 随机 特性 来 达到 压 
于 信 源 编码 理论 的 限定 使 得 传统 的 图 像 编码 具有 较 高 的 概括 性 和 综合 性 ， 并 在 
H.261、MPEG-I/MPEG-2 等 实际 应 用 中 获得 了 巨大 成 功 。 

















MPEG-4 在 博采众长 的 基 而 





键 技术 是 基于 视频 对 象 的 编码 。 
的 概念 。 这 一 概念 将 视频 场景 的 


感 兴趣 的 物体 的 形状 
VO)。VO 可 以 是 视频 序列 





辆 奔驰 的 汽车 ;也 可 以 是 计算 村 


分 析 可 将 其 分 割 为 n 个 VO(n 二 1l，2，3，…)， 对 同一 VO 编码 后 形成 VOP 数据 流 。VOP 的 
编码 包括 对 运动 (采用 运动 预测 方法 ) 及 纹理 (采用 变换 编码 方法 ) 的 编码 ， 其 基本 原理 与 H.26 




















\ 运 动 、 纹 理 等 , 而 同一 对 象 连续 的 VOP 称 为 一 个 视频 对 象 (Video Object， 
P 的 人 物 或 具体 的 景物 ， 如 电视 新 闻 中 的 播音 员 ， 或 是 电视 剧 中 一 
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x 





























1 上 ， 采 用 现代 图 像 编 码 方法 ， 利 用 人 眼 的 视觉 特性 ， 抓 住 图 


本 质 ， 从 轮廓 一 纹理 的 思路 出 发 ， 实 现 了 支持 基于 视觉 内 容 的 交互 功能 。 其 关 





为 此 MPEG-4 引入 了 视频 对 象 面 (Video Object Plane，VOP) 
一 帧 看 成 由 不 同 视频 对 象 面 VOP 所 组 成 ，VOP 可 以 是 人 个 




















图 形 技 术 生 成 的 二 维 或 三 维 图 形 。 对 于 输入 视频 序列 ， 通 过 




















和 MPEG-1/MPEG-2 极为 相似 。 


此 要 求 编码 方案 可 以 处 理 形状 (Shape) 和 透明 (Transparency) 信 息 ， 这 同 只 能 处 理 矩 形 帧 序列 的 











于 MPEG-4 基于 内 容 图 像 编码 方法 VOP 具有 任意 形状 ， 


























现 有 视频 编码 标准 形成 了 鲜明 的 对 照 。 在 MPEG-4 中 ， 甜 形 帧 被 认为 是 VOP 的 一 个 特例 ,这 


Iie 


| 
退化 为 类 似 于 H.261、MPEG-1/MPEG-2 的 传统 编码 系统 ， 











编码 系统 不 用 处 理 形状 信息 ， 














可 





也 实现 了 与 现 有 标准 的 兼容 。 从 甜 形 帧 到 VOP，MPEG-4 实现 了 从 基于 像素 的 





及 可 豆 


4. 基于 VOP 的 视频 编码 


于 对 象 和 内 容 的 现代 编码 的 方式 的 转变 ， 体 现 了 视频 编码 技术 的 最 新 发 展 成 果 。 








传统 编码 


五 





VOP 编码 器 通常 由 两 个 主要 部 分 组 成 : 形状 编码 和 纹理 、 运 动 信息 编码 。 其 
运动 预测 和 运动 补偿 部 分 同 现 有 标准 基本 一 致 。 

MPEG-4 在 MPEG 图 像 编码 标准 系列 中 第 一 次 引入 形状 编码 技术 。 为 了 支持 
功能 , 编码 器 可 对 图 像 序列 中 具有 任意 形状 的 VOP 进行 编码 。 但 编码 的 基本 技术 
16X16 像素 宏 块 (Macroblock) 来 设计 的 , 一 方面 考虑 到 与 现 有 标准 的 兼容 ， 另 一 方 
于 对 编码 器 进行 更 好 的 扩展 .VOP 被 限定 在 一 个 拢 形 窗口 内 , 称 之 为 VOP 窗口 (VOI 
窗口 的 长 、 宽 均 为 16 的 整数 倍 ， 同 时 保证 VOP 窗口 中 非 人 站 块 数目 最 少 。 


纹理 编码 、 


基于 内 容 的 
仍然 是 基于 
j 是 为 了 便 
P Window), 
标准 的 矩形 





H 








帧 可 认为 是 VOP 的 特例 ， ee 
合 ,对 各 种 形状 的 VOP 输入 序列 采用 固定 的 或 可 变 的 
变换 编码 与 帧 间 预 测 编码 相 结合 的 方法 ， 所 采用 的 kf 
码 率 (64kb/s 下 的 应 用 ， 由 于 方块 效应 较 明 pA 方 





。 系统 依据 不 

的 编码 算法 采用 

2 相同 。 
块 滤波 器 进行 相应 处 理 。 


司 的 应 用 场 
顺 内 (Intra) 


对 于 极 低 














1) 形状 编码 
将 “形状 ” 纳 





VO 的 形状 信息 有 两 类 : ee 
非 VOP 


形状 ，0 表 
术 ， 可 以 是 无 损 或 
0 表示 完全 透明 ( 相 
站 人 
。 目 前 的 标 ; 
ee 位 图 表 
操作 和 压缩 ， 在 最 





入 完整 的 视频 编码 标 标准 的 重大 贡献 。 


1 来 表示 VOP 的 


这 是 MPEG-4 对 MPEG 系 多 


二 久居 信息 用 0、 








区 域 ，! 表 未 VOP 区 域 。 二 值 形状 信息 的 编码 采用 基于 运动 补偿 块 的 技 
有 损 编 TN A pa, 其 中 
当 于 二 值 形 状 信息 中 的 0),255 表示 完全 不 透明 (相当 于 二 值 形状 信息 中 的 
二 关 的 二 过 和 DcT 方法 (网 人 各 坟 到 相 人 罗技 
宁 用 矩阵 的 形式 来 表示 三 值 或 交 度 形状 信息 ， 称 之 为 位 图 (或 阿尔 法 平面 )。 
示 法 具有 较 高 的 编码 效率 和 较 低 的 运算 复杂 度 。 但 为 了 能 够 进行 更 有 效 的 
终 的 标准 中 使 用 了 另 一 种 表示 方法 ， 即 借用 高 层 语义 的 描述 ， 以 轮廓 的 几 





























何 参数 进行 表征 。 


图 4.24 演示 了 典型 新 闻 节 目 头 肩 像 的 形状 编码 过 程 。 


MPEG-4 VLBY Core Coder 
MPEG-4 其 低速 霹 电 袖 图 像 核心 强权 器 
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it stream 


Pne 比特 流 
电视 图 像 
对 得 区 (Similarlo H263 MPEC.I) 

THL263MPEG-1 相 刀 ) 

Genneric MPEG-4 Coder 
Wideo 般 的 MPEG-4 编 蚂 涡 

A ee Shape ME bit stream 

os 形状 | (MV) 比特 流 
时 次 区 


4.24 ”MPEG-4 中 的 形状 编码 


1 全 


4 章 .上 肥  . 
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下 多 烘 体 技术 必 其 应 用 (第 己 矿 ) 
~ ”2) 运动 信息 编码 

MPEG-4 采用 运动 预测 和 运动 补偿 技术 去 除 图 像 信息 中 的 时 间 宛 余 度 ， 这 些 编码 技术 是 
现 有 标准 向 任意 形状 的 VOP 的 延伸 。VOP 的 编码 有 3 种 模式 ， 即 帧 内 (Intra-frame) 编 码 模式 
(LVOP)， 帧 间 (Imnter-frame) 预 测 编码 模式 P-VOP)， 帧 间 双 向 (Bidirectionally) 预 测 编码 模式 
(B-VOP)。 在 MPEG-4 中 运动 预测 和 运动 补偿 可 以 是 基于 16X 16 像素 宏 块 的 ， 也 可 以 是 基于 
8X8 像素 块 的 。 为 了 能 适应 任意 形状 的 VOP，MPEG-4 引入 了 图 像 填充 (Image Padding) 技 术 
和 多 边 形 匹配 (Polygon Matching) 技 术 。 图 像 填充 技术 利用 VOP 内 部 的 像素 值 来 外 推 VOP 外 
的 像素 值 ， 以 此 获得 运动 预测 的 参考 值 。 多 边 形 匹 配 技术 则 将 VOP 的 轮廓 宏 块 的 活跃 部 分 包 
含 在 多 边 形 之 内 ， 以 此 来 增加 运动 估 值 的 有 效 性 。 此 外 ，MPEG-4 采用 8 参数 仿 射 运动 变换 
来 进行 全 局 运动 补偿 ;支持 静态 或 动态 的 Sprite 全 局 运动 预测 (如 图 4.25 所 示 )， 对 于 连续 图 
像 序列 ， 可 由 VOP 全 景 存储 器 预测 得 到 描述 摄像 机 运动 的 8 个 全 局 运动 参数 ， 利 用 这 些 参数 
来 重建 视频 序列 。 栓 















































图 4.25 视频 序列 Sprite 编码 实例 


3) 纹理 编码 

纹理 编码 的 对 象 可 以 是 LVOP、B-VOP 或 P-VOP。 编 码 方法 仍 采 用 基于 8X8 像素 块 的 
DCT 方法 。I-VOP 编码 时 ， 对 于 完全 位 于 VOP 内 的 像素 块 ， 则 采用 经 典 的 DCT 方法 ， 对 于 
完全 位 于 VOP 之 外 的 像素 块 ， 则 不 进行 编码 ; 对 于 部 分 在 VOP 内 ， 部 分 在 VOP 外 的 像素 块 
则 首先 采用 图 像 填 充 技术 来 获取 VOP 之 外 的 像素 值 ， 之 后 再 进行 DCT 编码 。 对 B-VOP 和 
P-VOP 编码 时 ， 可 将 那些 位 于 VOP 活跃 区 域 之 外 的 像素 值 设 为 128 再 进行 预测 编码 。 此 外 ， 
还 可 采用 SADCT(Shape-adaptive DCT， 形 状 自 适应 DCT) 方 法 对 VOP 内 的 像素 进行 编码 ， 该 
方法 可 在 相同 码 率 下 获得 较 高 的 编码 质量 ， 但 运算 的 复杂 程度 稍 高 。 变 换 之 后 的 DCT 因子 还 
需 经 过 量化 (采用 单一 量化 因子 或 量化 矩阵 )、 扫 描 及 变 长 编码 , 这 些 过 程 与 现 有 标准 基本 相同 。 

4) 分 级 编码 

分 级 编码 是 为 实现 需要 系统 支持 时 域 、 空 域 及 质量 可 伸缩 的 多 媒体 应 用 而 制定 的 。 例 如 ， 
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和 
| 人 


在 远程 多 媒体 数据 库 检索 及 视频 内 容重 放 等 应 用 中 ， 分 级 编码 的 引入 使 得 接收 机 可 依据 具体 




















的 通道 带宽 、 系 统 处 理 能 力 、 显 示 能 力 及 用 户 需 求 进行 多 分 辩 率 的 解码 











习 放 。 接 收 机 可 视 具 





体 情 况 对 编码 数据 流 进行 部 分 解码 。 若 要 求 较 低 的 解码 复杂 度 ， 同 时 也 意味 着 较 低 的 重建 图 
像 质量 、 较 低 的 空间 分 状 率 和 时 间 分 辨 率 ， 即 相同 空间 分 辨 率 及 帧 率 条 件 下 ， 较 低 的 重建 图 














像 质量 。 MPEG-4 通过 视频 对 象 层 VOL 的 数据 结构 来 实现 分 级 编码 。 每 一 种 分 级 编码 都 至 少 





有 两 层 VOL， 低 层 称 为 基本 层 ， 高 层 称 为 增强 层 。 空 间 伸缩 性 可 通过 增强 层 强化 基本 层 的 空 
间 分 辩 率 来 实现 ， 因 此 在 对 增强 层 中 的 VOP 进行 编码 之 前 ， 必 须 先 对 基本 层 中 相应 的 VOP 
进行 编码 。 同 样 对 于 时 域 伸缩 性 , 可 通过 增强 层 来 增加 视频 序列 中 某 个 VO( 特 别 是 运动 的 VO) 




















的 帧 率 ， 使 它 与 其 余 区 域 相 比 更 为 平滑 。 








MPEG-4 引入 VO 的 目的 是 希望 实现 基于 内 容 的 编码 ， 但 对 视频 流 中 的 对 象 提取 问题 涉 
及 模式 识别 等 诸多 方面 的 问题 ， eam 所 以 真正 意义 的 























基于 VO 的 视频 编码 技术 还 有 很 长 的 路 要 走 。 A 
NN\ 
4.3.5 “多 媒体 内 容 描述 接口 标准 MPEG-7 


对 于 多 媒体 信息 ， 本 实现 基于 内 容 的 检索 的 关 和 是 定义 各 并 思 多 信条 信息 内 容 及 
的 方法 。MPEG-7 的 目标 就 是 为 多 媒体 信息 制定 一 种 标准 化 的 描述 方法 ， 即 多 媒体 内 容 














竺 征 
措 述 








接口 (Multimedia Content Description Interface)。 ` 这 种 描述 与 多 媒体 信息 的 内 容 一 起 ， 帮 助 


实现 对 多 媒体 信息 基于 内 容 的 快速 的 检索 MPEG-7 采用 以 下 的 概念 来 描述 多 媒体 信息 。 
(1) 特征 : 数据 的 特性 。 特 征 本 身 不 能 比较 ， 它 需要 使 用 描述 子 和 描述 值 来 表示 ， 如 图 像 
,VX 


的 颜色 、 语 音 的 声调 、 音 频 的 旋律 等 。 XU 
人 
值 。 一 个 特征 可 能 有 多 个 描述 子 ， 如 颜色 特征 可 能 的 
值 、 运 动 的 场 描述 、 标 题 文本 等 。 ~ 
G) 描述 值 小 摇 述 子 的 实例 。 描 述 值 与 描述 模式 结合 ， 形 成 描述 。 


月 户 








描述 


描述 子 有 颜色 直方 图 、 频 率 分 量 的 平均 


(4) 描述 模式 (Description Scheme，DS): 说 明 其 成 员 之 间 的 关系 结构 和 语义 。 成 员 可 以 是 
描述 子 和 描述 模式 。 描 述 模式 和 描述 子 的 区 别 是 ， 描 述 子 仅仅 包含 基本 的 数据 类 型 ;不 引用 
其 他 描述 子 或 描述 模式 ， 如 对 于 影片 ， 按 时 间 结 构 化 为 场景 和 镜头 ， 在 场景 级 包括 一 些 文本 





描述 子 ， 在 镜头 级 包含 颜色 、 运 动 和 一 些 音频 描述 子 。 
(5) 描述 : 由 一 个 描述 模式 和 一 组 描述 值 组 成 。 




















(6) 编码 的 描述 : 对 已 完成 编码 的 描述 ,满足 诸如 压缩 效率 、 差 错 恢复 和 随机 存 取 的 相关 


(7) 描述 定义 语言 (Description Definition Language，DDL): 一 种 允许 产生 新 的 描述 模式 和 


描述 子 的 语言 ， 允 许 扩 展 和 修改 现 有 的 描述 机 制 。 
MPEG-7 主要 工作 是 标准 化 以 下 内 容 。 
(1) 描述 方案 和 描述 符 的 集合 。 
(2) 指定 描述 方案 的 语言 ， 即 DDL。 
(3) 描述 的 编码 策略 。 





MPEG-7 标准 需要 制定 有 关 静 止 图 像 、 图 形 、 音 频 、 动 态 视频 及 合成 信息 的 描述 方法 ， 
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一 而 这 种 基于 内 容 的 标准 化 描述 可 以 附加 到 任何 类 型 的 多 媒体 资料 上 ， 不 管 多 媒体 资料 的 表示 


格式 如 何 ， 以 及 压缩 形式 如 何 ， 加 上 了 这 种 标准 化 描述 的 多 媒体 数据 就 可 以 被 索引 和 检索 了 。 
MPEG-7 标准 可 以 独立 于 其 他 MPEG 标准 使 用 ， 但 MPEG-4 中 所 定义 的 音频 、 视 频 对 象 的 描 
述 适 用 于 MPEG-7。MPEG-7 的 适用 范围 广泛 ， 既 可 以 应 用 于 存储 ， 也 可 以 用 于 流 式 应 用 , 它 
还 可 以 在 实时 或 非 实时 的 环境 下 应 用 。MPEG-7 的 系统 组 成 如 图 4.26 所 示 。 


























图 4. 2 ‘pee: 7 的 系统 组 成 


MPEG-7 标准 不 包括 对 描述 特征 的 自动 提取 ， 因此 特征 提取 技术 不 是 MPEG-7 的 标准 
分 。 这 样 做 的 目 的 是 可 以 使 这 些 算 法 的 新 进展 及 时 物化 ; 避免 阻碍 未 来 MPEG-7 的 应 用 ， 和 
时 生产 厂家 可 以 在 这 些 算法 中 "体现 自己 的 特色 ， 充分 发 近 自身 优势 搜索 引擎 和 数据 库 的 组 
织 也 是 MPEG-7 的 非 标准 部 分 。 另 外 ， 和 以 前 的 MPEG 标准 一 样 ，MPEG-7 只 标准 化 它 的 码 
流 语法 ， 只 规定 了 解码 器 的 标准 ， 而 编码 器 的 具体 实现 不 在 标准 之 内 。 

MPEG-7 标准 的 制定 将 主要 应 用 于 以 下 领域; 数字 化 图 书馆 、 多 媒体 目录 服务 、 广 播 式 
媒体 选择 、 多 媒体 编辑 、 教 育 、 娱 乐 、 新 闻 、 旅 游 、 医 疗 、 购 物 、 地 理 信息 系统 等。 








4.4 ITU-T H.26x 视听 通信 编码 解码 标准 


4.4.1 H.26x 标准 简介 


数字 视频 技术 广泛 应 用 于 通信 、 计 算 机 、 广 播 电 视 等 领域 ， 带 来 了 会 议 电视 、 可 视 电话 
及 数字 电视 、 媒 体 存储 等 一 系列 应 用 ， 促 使 了 许多 视频 编码 标准 的 产生 。ITU-T 是 国际 电信 
同盟 远程 通信 标准 化 组 (ITU Telecommunication Standardization Sector) 的 简称 ,成 立 于 1993 年 ， 
其 前 身 为 国际 电报 电话 咨询 委员 会 。ITU-T 与 ISO/IEC 是 制定 视频 编码 标准 的 两 大 组 织 。 
ISO/IEC 负责 制定 了 MPEG 系列 视频 压缩 编码 国际 标准 ， 主 要 应 用 于 视频 存储 (DVD)、 广 播 
电视 、Internet 或 无 线 网 上 的 流 媒 体 等 。 而 ITU-T 制定 出 了 H.26x( 包 括 H.261、H.262、H.263、 
H.264 等 ) 系 列 电信 行业 的 国际 标准 。H.26x 主要 应 用 于 实时 视频 通信 领域 ， 如 会 议 电视 ， 两 
个 组 织 也 共同 制定 了 一 些 标准 ，H.262 标准 等 同 于 MPEG-2 的 视频 编码 标准 ,而 最 新 的 H.264 
标准 则 被 纳入 MPEG-4 的 第 十 部 分 。 可 以 说 从 标准 产生 的 时 间 、 参 与 制定 标准 的 专家 及 采 
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| 
的 关键 技术 等 方面 看 ， MPEG 系列 标准 与 H.26x 系列 标准 都 有 着 千 丝 万 缕 的 联系 。 
1，H.261 视频 编码 标准 


H.261 是 ITU-T 为 在 综合 业务 数字 网 ISDN) 上 开展 双向 声 像 业务 (可 视 电话 、 视 频 会 议 ) 
而 制定 的 ， 主 要 针对 于 64Kb/s 的 多 重 数据 率 而 设计 。 几 乎 与 MPEG 同时 ，1988 年 ，ITU-T 
开始 制定 H.261, 并 于 1990 年 12 月 正式 公布 。 它 又 称 为 Px64, 其 中 P 为 1 到 30 的 可 变 参 数 。 
这 些 数 据 率 适合 于 ISDN 线路 ， 因 此 设计 出 视频 编 和 译 码 。H.261 结合 携带 RTP 的 任意 底层 
协议 ， 并 利用 实时 传输 协议 RTP 传输 视频 流 。H.261 只 对 CIF( 分 辩 率 为 352X288) 和 QCIF( 分 
辩 率 为 176X 144) 两 种 图 像 格式 进行 处 理 ， 每 帧 图 像 分 成 图 像 层 、 宏 块 组 (GOB) 层 、 宏 块 (MB) 
层 、 块 (Block) 层 来 处 理 。H.261 是 最 早 的 运动 图 像 压缩 标准 ， 它 详细 制定 了 视频 编码 的 各 个 
部 分 ， 包 括 运动 补偿 的 帧 间 预 测 、DCT 变换 、 量 化 、 炉 编码 ， 以 及 与 固定 速率 的 信道 相 适 配 
的 速率 控制 等 部 分 。 具 体 技术 可 参阅 4.4.2 节 的 有 关内 容 。 

2.H.263 视频 编码 标准 < 

HL263 是 ITU-T 第 一 个 专 为 低 于 64Kb/s 的 窄带 通信 信道 制定 的 视频 编码 标准 。1996 年 3 
月 制定 完成 后 ， 又 在 H.263 十 及 H.263 十 十 等 升级 版 本 了 许多 更 强大 的 功能 ， 使 其 具有 
更 广泛 的 适用 性 。H.263 以 H.261 为 基础 ， 该 标准 和 对头 内 庄 缩 采用 变换 编码 但 对 帧 间 压 缩 采 
的 预测 编码 进行 了 改进 ， 主要 介 半 人 本 汉代、 无 限制 运动 矢量 、 基 于 句法 的 算 
术 编 码 、PB- 帧 及 先进 的 预测 算法 等 Sa 图 像 格 式 可 以 是 S-QCIF、QCIF、CIF、4CIF 
或 者 16CIF 的 彩色 4 : 2 : 0 取样 图 像 % 

(1) 无 限制 运动 矢量 。 无 限制 运 帮 入 式 公交 运动 和 相向 图 人 以外 的 区 谨 ， 当 某 一 运 
动 估量 所 指 的 参考 安信 于 编 碍 图像 之 外 时 ， 尝 用 其 这 缘 的 图 像 像素 值 来 代 普 。 当 存在 路 边 
界 的 运动 时 ， 这 种 模式 能 取得 很 大 的 编码 增益 , “对 小 图 像 尤其 有 效 。 此 外 ， 该 模式 还 包括 了 
运动 矢量 范围 的 扩展 人 允许 使 用 更 大 的 运动 矢量 3 有 利于 摄像 机 运动 方式 的 编码 。 

(2) 基于 法 的 算术 编码 。 基 于 句法 的 算术 编码 比 哈 夫 曼 编码 可 以 更 大 幅度 地 降低 码 率 。 

(3) 先进 的 预测 筑 式 。 先 进 的 预测 模式 允许 一 个 宏 块 中 4 个 8X8 亮度 块 各 对 应 一 个 运动 
矢量 ， 从 而 提高 预测 精度 ;两 个 色 度 块 的 运动 矢量 则 取 这 4 个 亮度 块 运动 矢量 的 平均 值 。 补 
偿 时 , 使 用 重 全 的 块 运动 补偿 , 8X8 亮度 块 的 每 个 像素 的 补偿 值 由 3 个 预测 值 加 权 平 均 得 到 。 
使 用 该 模式 可 以 产生 显著 的 编码 增益 ， 特 别 是 采用 重 肥 的 块 运动 补偿 ， 会 减少 块 效应 ， 提 高 
主观 质量 。 
(4) PB- 帧 。PB- 帧 模式 规定 一 个 PB- 帧 包含 作为 一 个 单元 进行 编码 的 两 帧 图 像 。PB- 帧 模 
式 可 在 码 率 增加 不 多 的 情况 下 ， 使 帧 率 加 倍 。 
在 H.263 基础 上 ，1998 年 ，ITU-T 发 布 了 H.263 标准 的 版 本 2， 非 正式 地 命名 为 H.263 十 
标准 。 在 向 下 兼容 的 同时 ， 进 一 步 提高 了 压缩 效率 或 改善 某 方 面 的 功能 。H.263 十 标准 允许 更 
大 范围 的 图 像 输 入 格式 和 自 定义 图 像 的 尺寸 ， 使 之 可 以 处 理 基 于 视窗 的 计算 机 图 像 、 更 高 帧 
频 的 图 像 序列 及 宽屏 图 像 。H.263 十 采用 先进 的 帧 内 编码 模式 、 增 强 的 PB- 帧 模式 和 去 块 效应 
滤波 器 ， 在 提高 压缩 效率 的 同时 ， 也 提高 了 重建 图 像 的 质量 。H.263 十 增加 了 时 间 分 级 、 信 噪 
比 和 空间 分 级 ， 另 外 还 对 片 结构 的 模式 、 参 考 帧 的 选择 模式 等 进行 了 改进 ， 以 适应 误 码 率 较 
高 的 网 络 传输 环境 。 

在 H263 十 基础 上 ,为 了 增强 码 流 在 恶劣 信道 上 的 抗 误 码 性 能 ， 同 时 为 了 提高 增强 编码 效 
率 ，H263 十 十 又 增加 了 U、V、W3 个 选项 。 
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4 章 . 胎 . 
-WO 


ee 政史 并 体 找 坟 肥 其 应 用 第 之 服 ) 
一 (1) 选项 U 一 一 增强 型 参考 帧 选择 , 用 于 提供 增强 的 编码 效率 和 信道 传输 错误 的 再 生 能 力 
(如 包 丢 失 )， 它 需要 有 多 个 缓冲 区 用 于 存储 多 参考 帧 图 像 ， 以 便 进行 错误 的 恢复 。 
(2) 选项 V 一 一 数据 分 片 ， 能 够 提供 增强 型 的 抗 误 码 能 力 (特别 是 在 传输 过 程 中 本 地 数据 
被 破坏 的 情况 下 )， 通 过 分 离 视频 码 流 中 DCT 的 系数 头 和 运动 矢量 数据 ， 采 用 可 逆 编 码 方式 
保护 运动 矢量 。 
(3) 选项 W 一 一 在 H263 十 的 码 流 中 增加 补充 信息 ， 保 证 增强 型 的 反 向 兼容 性 ， 附 加 信息 
包括 : 指示 采用 的 定点 IDCT、 图 像 信 息 和 信息 类 型 、 任 意 的 二 进 制 数据 、 文 本 、 重 复 的 图 像 
头 、 交 蔡 的 场 指 示 、 稀 玻 的 参考 帧 识别 。 


3，H.264 视频 编码 标准 


H.264 也 被 称 为 MPEG-4 AVC， 是 由 ISO/IEC 与 ITU-T 组 成 的 联合 视频 组 (JVT) 制 定 的 新 
一 代 视 频 压缩 编码 标准 。ITU-T sols ar Ds, 标准 后 的 1998 年 1 
月 ， 开 始 研究 制定 一 种 新 标准 以 支持 极 低 码 率 的 视频 通信 ， 即 HH.26L 1999 年 9 月 ， 完 成 第 

-个 草案 ，2001 年 5 月 制定 了 其 测试 模式 TML-8， 并 于 20024E6 月 的 JVT 第 5 次 会 议 通 过 
了 H.264 的 FCD(Final Committee Draft， 草 案 最 终 稿 ) 版 : 52001 年 ，ISO 的 MPEG 组 织 认识 到 
H.26L 潜在 的 优势 , 便 与 ITU 开始 组 建 包括 来 自 ISOUEC MPEG 与 ITU-TVCEG 的 JVT。JVT 
的 主要 任务 是 将 H.26L 草案 发 展 为 一 个 上 示 性 标准 ， 并 在 ISO/IEC 中 该 标准 命名 为 
AVC(Advanced Video Coding)， 作 为 MPEG-4 标 的 第 十 个 选项 ， 而 在 ITU-T 中 正式 命名 为 
H.264 标准 。H.264 可 以 在 相同 的 重建 图 像 质量 下 比 H.263 十 和 MPEG-4(SP) 减 小 50% 码 率 ， 
同时 对 信道 延 时 适应 性 增强 。 H.264 区 可 满足 低 延 时 的 实时 瑟 务 需要 (如 会 议 电 视 等 )， 也 可 满 
足 无 延 时 限制 的 视频 存储 等 场合 。,、 yy wx 

H.264 提高 网 络 适应 性 7 强 做 了 对 误 码 和 丢 包 的 理 , 提高 了 解码 器 的 差错 恢复 能 力 。 在 

编 /解码 器 中 对 图 像 质量 进行 了 可 分 级 处 理 ， 以 适应 不 同 复杂 度 的 应 用 。 在 H.264 还 增加 了 4X 
4 整数 变换 、 空域 内 的 忻 内 预测 、 1/4 像素 精度 的 : 动 估计 、 多 参考 帧 与 多 种 大 小 块 的 帧 间 预 
测 技术 等 。 新 技术 带 来 了 较 高 的 压缩 比 ， 同时 大 大 提高 了 算法 的 复杂 度 。 
(1) 4X4 整数 变换 。H.26L 中 建议 的 整数 变换 采用 基于 4X4 的 DCT 变换 ， 在 大 大 降低 
算法 的 复杂 度 的 同时 对 编码 的 性 能 几乎 没有 影响 ， 而 且 实际 编码 还 稍 好 一 些 。 
(2) 基于 空域 的 帧 内 预测 技术 。 视 频 编码 是 通过 去 除 图 像 的 空间 与 时 间 宛 余 度 来 达到 压缩 
的 目的 。 空 间 宛 余 度 通 过 变换 技术 消除 (如 DCT 变换 、H.264 的 整数 变换 )， 时 间 宛 余 度 通 过 
页 间 预测 来 去 除 。 在 此 前 的 编码 技术 中 ， 变 换 仅 在 所 变换 的 块 内 进行 (如 8X8 或 者 4X4)， 并 
没有 块 与 块 之 间 的 处 理 。H.263 十 与 MPEG-4 引入 了 帧 内 预测 技术 , 在 变换 域 中 根据 相 邻 块 对 
当前 块 的 某 些 系数 做 预测 。H.264 则 是 在 空域 中 , 利用 当前 块 的 相 邻 像 素 直接 对 每 个 系数 做 预 
测 , 更 有 效 地 去 除 相 邻 块 之 间 的 相关 性 , 极 大 地 提高 了 帧 内 编码 的 效率 。H.264 基本 部 分 的 帧 
内 预测 包括 9 种 4X4 亮度 块 的 预测 、4 种 16X 16 亮度 块 的 预测 和 4 种 色 度 块 的 预测 。 
(3) 运动 估计 。H.264 的 运动 估计 具有 3 个 新 的 特点 : 1/4 像素 精度 的 运动 估计 ，7 种 大 小 
不 同 的 块 进行 匹配 ， 前 向 与 后 向 多 参考 帧 。H.264 在 帧 间 编 码 中 ， 一 个 宏 块 (16X16) 可 以 被 分 
为 16X8、8X16、8X8 的 块 ， 而 8X8 的 块 被 称 为 子 宏 块 ， 又 可 以 分 为 8X4、4X8、4X4 的 
块 。 总 体 而 言 ， 共 有 7 种 大 小 不 同 的 块 做 运动 估计 ， 以 找 出 最 匹配 的 类 型 。 与 以 往 标准 的 P 
页、B 帧 不 同 ，H.264 采用 了 前 向 与 后 向 多 个 参考 帧 的 预测 。 半 像素 精度 的 运动 估计 比 整 像素 
运动 估计 有 效 地 提高 了 压缩 比 ， 而 1/4 像素 精度 的 运动 估计 可 带 来 更 好 的 压缩 效果 。 
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编码 器 中 运用 多 种 大 小 不 同 的 块 进行 运动 估计 , 可 节省 15% 以 上 的 比特 率 (相对 于 16X16 
的 块 )。 运 用 1/4 像素 精度 的 运动 估计 ， 可 以 节省 20% 的 码 率 (相对 于 整 像素 预测 )。 多 参考 帧 
预测 方面 ， 假 设 为 5 个 参考 帧 预测 ， 相 对 于 一 个 参考 帧 ， 可 降低 5% 一 10% 的 码 率 。 

(4) 焙 编 码 。.H.264 标准 采用 的 炳 编码 有 两 种 :一 种 是 基于 内 容 的 自 适应 变 长 编码 (CAVLC) 
与 统一 的 变 长 编码 (UVLC) 结 合 ， 另 一 种 是 基于 内 容 的 自 适应 二 进 制 算术 编码 (CABAC)。 
CAVLC 与 CABAC 根据 相 临 块 的 情况 进行 当前 块 的 编码 ， 以 达到 更 好 的 编码 效率 。CABAC 
比 CAVLC 压缩 效率 高 ， 但 要 复杂 一 些 。 

(5) 去 块 效应 滤波 器 。H.264 标准 引入 了 去 块 效应 滤波 器 ， 对 块 的 边界 进行 滤波 ， 滤 波 强 
度 与 块 的 编码 模式 、 运 动 矢量 及 块 的 系数 有 关 。 去 块 效应 滤波 器 在 提高 压缩 效率 的 同时 ， 改 
善 了 图 像 的 主观 效果 。 


4.4.2 了 .261 标准 中 的 主要 技术 


H.261 标准 中 的 编码 算法 主要 有 变换 编码 、 Same th 和 帧 内 编码 采用 JPEG， 
帧 问 采用 预测 编码 和 运动 补偿 。 编 码 算法 的 数据 率 为 40KbASs2Mb's。H.261 标准 中 的 关键 技 
术 与 MPEG-1 的 基本 技术 原理 十 分 相似 。 在 H.261 的 编码 序列 中 ， 只 有 帧 内 图 ( 图 ) 和 预测 图 
(P 图 ) 而 没有 插 补 图 (B 图 )， 其 解码 图 像 序列 如 图 2 也 示 。 
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外 2 
图 4.27 ”H.261 标准 的 解码 图 像 序列 


H.261 的 压缩 编码 过 程 要 经 过 转换 、 预 处 理 、 源 图 像 编 码 、 多 元 视频 编码 和 传输 编码 等 多 
个 过 程 。 其 压缩 编码 处 理 过 程 如 图 4.28 所 示 。 











编码 位 流 
4.28”H.261 的 压缩 编码 流程 


1. 向 下 转换 
向 下 转换 主要 有 两 项 工作 ， 首 先是 将 模拟 视频 信号 转 成 CIF 或 QCIF 格式 的 数字 图 像 ， 
其 次 图 像 的 色彩 空间 由 RGB 模式 转换 为 YUV 模式 。 
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下 多 媒体 找 坟 及 其 应 用 (第 之 服 ) 
2. 预 处 理 
视频 信号 的 模 数 转换 和 格式 转换 成 会 引入 噪声 及 假 频 瑕 疫 。 预 处 理 的 目的 是 减少 噪声 及 
假 频 瑕 疲 的 影响 ， 使 画面 看 起 来 比较 柔和 。 预 处 理 通常 采用 平滑 算法 (如 线性 低 通 滤波 器 )。 
3. 源 编码 


源 编码 阶段 采用 的 主要 方法 有 转换 编码 (基于 8X8 的 DCT)、 量 化 、 炉 编码 、 运 动 估计 征 
运动 补偿 等 。 其 中 前 3 项 技术 与 MPEG-1 中 采用 的 JPEG 帧 内 压缩 编码 方法 完全 一 致 。 在 运 
动 估计 及 补偿 阶段 所 使 用 的 预测 与 补偿 技术 与 MPEG-1 没有 太 大 的 区 别 ， 但 H.261 只 考虑 预 
测 图 像 P 图 ) 的 编码 问题 ， 这 是 与 MPEG-1 最 大 的 不 同 之 处 。P 图 的 产生 可 以 使 用 I 图 或 前 一 
个 P 图 。P 图 的 使 用 可 以 较 大 幅度 降低 编码 率 ， 但 了 et 的 误差 将 会 向 下 一 个 P 图 
传递 ， 从 而 导致 误差 的 放大 增值 。 所 以 在 实际 应 用 中 ，P 图 的 连 多 人 3 帧 ， 这 样 既 
达到 了 数据 压缩 的 目的 ， 同 时 ， ET A 图 就 已 经 出 现 。 

























































































4， 传 输 缓冲 器 

H.261 的 传输 缓冲 器 与 MPEG-1 中 的 信道 组 ea 在 炳 编码 和 运动 补偿 阶段 
的 编码 过 程 中 ， 因 为 采用 了 emp 以 对 视频 信息 编码 后 产生 的 编码 率 不 是 恒 
定 不 变 的 ， 但 在 输出 端的 位 从 出 率 是 国定 的 。 因 此 必须 设置 一 个 传 答 吕 缓冲 器 来 对 数据 进行 
缓冲 处 理 ， 并 由 传 和 缓冲 名 中 数据 3 \ 采 控制 编码 器 的 编码 数据 的 速率 ， 以 保证 信息 压 
缩 的 进度 和 传输 。 党 让 





4.5 小、 六 








oe 介绍 于 数据 压缩 的 基本 原理 与 方法 、 静态 图 像 压 缩编 
码 国际 标准 JPEG 及 JPEG 2000、ISO/IEC 制定 的 运动 图 像 压 缩编 码 国际 标准 MPEG 系列 和 
ITU-T 制定 的 H.26x 系列 。 其 中 ， 对 数据 压缩 的 基本 原理 、 常 用 的 压缩 编码 方法 、JPEG 压缩 
编码 方法 、 小 波 分 割 与 变换 算法 、MPEG-1 压缩 编码 过 程 与 算法 进行 了 较为 详细 的 讲述 。 同 
时 对 JPEG2000、MPEG-2、MPEG-4、MPEG-7、H.26x 的 框架 和 主要 技术 进行 了 概要 性 的 介 
绍 ， 并 对 MPEG 系列 标准 与 H.26x 系列 标准 的 关系 进行 了 讲述 。 本 章 内 容 是 深入 了 解 多 媒体 
信息 压缩 编码 技术 的 基础 ， 也 为 进一步 学 习 多 媒体 技术 的 相关 知识 打下 了 坚实 的 基础 。 























4.6 习 题 


1. 填空 题 

(1) 计算 机 中 处 理 的 多 媒体 信息 需要 压缩 的 原因 是 
(2) 行程 长 度 编码 的 基本 思想 是 

(3) 预测 编码 的 基本 思想 是 

(4) 变换 编码 的 基本 思想 是 





nel 
里 巡 扩 | 


(5) 矢量 量化 编码 的 基本 思想 是 

(6) MPEG-7 是 .制定 MPEG-7 的 目的 是 

2. 单 选 题 

(1) 下 列 关 于 无 损 压 缩 的 说 法 ， 不 正确 的 是 _ 
A. 压缩 后 的 数据 在 还 原 后 与 原 数据 完全 一 致 
B. 压缩 比 一 般 为 2 : 1~5 : 1， 一 般 用 于 文本 
C. 一 般 用 于 数据 及 应 用 软件 的 压缩 
D. 这 种 压缩 是 不 可 逆 的 基于 对 象 的 编码 

(2) 下 列 关于 多 媒体 数据 压缩 的 说 法 ， 不 正确 的 是 __ 
A. 元 余 度 压缩 是 一 个 不 可 逆 过 程 ， 也 称 有 失真 压缩 

B. 数据 中 间 尤 其 是 相 邻 的 数据 之 间 ， 常 存在 着 相关 性 伦 

NN 


























C。 可 以 利用 某 些 变换 来 尽 可 能 地 去 掉 数 据 之 间 的 相 
D。 去除 玫 加 中 的 元 余 信 息 ， 可 以 实现 对 数据 的 区 角 
G) 多 媒体 数据 压缩 的 评价 标准 包括 3 个 方面 
A， 压 缩 比率 、 压 缩 与 解压 缩 的 速度 、 编 码 男 法 
B。， 压缩 质量 、 压 缩 与 解压 缩 的 速度 
: 缩 比率 、 压 缩 质量 、 人 的 速度 
D. lr cd 
(4) 根据 压缩 前 后 的 数据 是 否 完 全 致 ,可 分 为 压缩 。 
A. 音频 、 视频” 了 1 昼 态 、 前 术 有 损 。 。 D. 图 像 、 文 字 
(6) 利用 视频 图 像 各 祝 之 同 的 。， 用 由 nt 
,Wa Tt 


A. NO B， 像素 相关 性 C. 位 置 相关 性 D. 时 间 相 关 性 
(6) 下 多 符 序列 采用 行程 编码 ， 可 以 获得 最 高 的 压缩 比 。 



































A. AAAADDDDRRGHDDD B. AAADDDDDRRGDDDD 
C. AADDDDRRRRRRDDD D. AAAADDDDRRGGGGF 
(7) 以 下 的 编码 方法 中 ， 不 属于 统计 编码 的 是 _ 
A. 变换 编码 B. 行程 编码 C. 哈 夫 曼 编码 D. 算术 编码 


(8) MP3 音乐 文件 是 目前 最 为 流行 的 音乐 文件 。 当 录制 了 WAV 音频 格式 文件 后 , 希望 压 
缩 为 MP3 格式 ， 采 用 __” 压缩 标准 能 够 实现 。 








A. MPEG-1 B. MPEG-2 C. MPEG-4 D. MPEG-7 
(9) 图 像 序列 中 的 两 幅 相 邻 图 像 ， 后 一 幅 图 像 与 前 一 幅 图 像 之 间 较 大 相关 性 属于 元 余 。 
A. 信息 焙 B. 时 间 C. 空间 D. 视觉 

(10) 以 下 ”属于 统计 编码 。 
A. 行程 编码 、 变 换 编码 B. 哈 夫 曼 编码 、 预 测 编 码 
C. PCM 编码 、 算 术 编 码 D. 行程 编码 、 哈 夫 曼 编码 


(11) 下 列 关 于 预测 编码 的 说 法 ， 正 确 的 是 __ 
A. 预测 编码 的 算法 模型 是 固定 的 
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4 章 . 有 m 
- 辣 


比较 文件 的 大 小 ， 并 分 析 原 因 。 


Fe 


ee 之 厂 ) 
.预测 编码 只 需 存储 和 传输 预测 误差 
C. 预测 编码 只 能 针对 空间 元 余 进 行 压缩 
D. 预测 编码 压缩 有 PCM 和 ADPCM 
(12) MPEG-1 标准 在 对 动态 图 像 压缩 时 采用 的 是 基于 __ 的 变换 编码 技术 。 














A. DCT B. K-L 变换 C. DFT D. DWT 
(13) 标准 被 称 为 “多 媒体 内 容 描 述 接口 ”， 用 于 解决 多 媒体 信息 的 检索 问题 。 
A. MPEG-1 B. MPEG-2 C. MPEG-4 D. MPEG-7 


(14) 下 列 关于 多 媒体 原始 数据 元 余 类 型 的 说 法 ， 正 确 的 是 
A. 人 了 眼 对 低 于 某 一 极限 的 幅度 变化 已 无 法 感知 等 属于 结构 元 余 
B， 图 片 中 的 纹理 表现 出 相当 强 的 规律 性 属于 视觉 元 余 

C. 电视 信号 的 相 邻 帧 之 间 可 能 只 有 少量 的 变化 ， 声 音 y 鼎 时 具有 一 定 的 规律 性 和 


同期 性 等 属于 知识 元 余 

9 国人 有 9 的 于 家， 
3， 多 选 题 KAN 
On， 

A， 行程 长 度 编码 二 维 空间 的 DPCM 编码 

C， 炳 编码 RW D。 基于 对 象 的 编码 
(2) MPEG-2 对 MPEG-1 的 发 展 主要 笨 现 在 pa 面 wX| 、 

A. 音频、 视频 、 王波 有 成 、 音 视频 控制 等 方面 进行 了 扩充 





















































B. 保持 了 向 下 兼容 、 PK 
C， 实 现 了 分 级 编码“ -要 
了 御 能 化 的 对 象 分 着 与 编 
pp “中 ， 为 提高 数据 的 压缩 比 采用 的 守 妥 压 绚 技 术 有 ~ 
A. ZZ 型 扫描 的 行程 长 度 编码 B. 空间 的 DPCM 山下 
C. 燃 编码 D. 运动 估计 与 补偿 E. 分 级 编码 
(4) MPEG-4 中 采用 基于 VOP 的 视频 编码 新 技术 主要 有 
A， 形 状 编码 B. 运动 信息 编码 
C. 纹理 编码 D. 分 级 编码 
(5) MPEG-1 与 H.261 共同 采用 的 压缩 编码 技术 有 _ 
A. 帧 内 的 变换 编码 B. 相间 的 预 质 测 编码 
C. 运动 估计 与 补偿 D. 基于 VOP 的 分 级 编码 











(6) 在 JPEG 标准 中 使 用 了 _ _ 统计 编码 方法 。 
A. 哈 夫 曼 编码 B. PCM 编码 C. 算术 编码 D. 变换 编码 


4. 操作 题 
(1) 利用 画图 (或 其 他 图 像 处 理工 具 ) 制 作 一 幅 图 像 ， 分 别 保存 为 BMP 格式 和 JPG 格式 ， 












































| 总 镭 有 











多 媒体 数据 压缩 技术 wy 
(2) 根据 表 4-5 中 的 信息 及 出 现 的 概率 ， 利 用 哈 夫 曼 算 法 ， 求 出 其 编码 (提示 : 答案 不 
唯一 ) 
表 4-5 信息 及 出 现 的 概率 表 
信息 As 
出 现 概率 0.01 
(3) 一 个 信息 符号 集 为 {a，b，c，d}， 每 个 符号 对 应 的 概率 分 别 为 {0.4，0.1，0.3，0.2 }， 






当 输 入 的 信息 


为 baacd 时 ， 写 出 其 算术 编码 及 解码 过 程 。 
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第 5 草 多 媒体 计算 机 动画 技术 


教学 提示 


ee 

> 计算 机 动画 是 多 媒体 应 用 系统 中 不 可 缺少 的 重要 技术 之 一 。 动 画作 
为 一 种 人 们 喜 闻 乐 疯 的 信息 表现 形式 ， 在 多 媒体 计算 机 的 多 种 信息 
媒体 中 受到 了 从 们 的 普遍 欢迎 。 其 应 用 范围 从 专业 影视 片 的 制作 、 
广告 宣传 、 教育 培训 到 工程 设计 几乎 无 处 不 有 。 目 前 计算 机 动画 已 
从 早期 的 三 维 动画 发 展 到 了 三 维 动 务 。 如 今 一 些 在 高 性 能 机 器 上 制 
作 的 动画 甚至 可 以 达到 以 假 乱 真 的 程度 。 














教学 目标 

| 

“本章 将 介绍 计算 枫 动 末 的 基本 知识 ,动画 的 分 类 、 生 成 过 程 、 计 算 机 
中 二 维 、 三 维 动画 的 有 关 概 念 、 实 现 方 法 、 相 关 技术 、 动 画 语 言 、 动 
画 传输 ， 以 及 发 展 趋势 等 内 容 .通过 本 章 的 学 习 ， 要 求 掌 握 计 算 机 动 
画 的 基本 概念 ， 了 解 常用 的 动画 制作 软件 和 动画 制作 的 基本 知识 等 。 


AI a 


“多 媒体 计算 机 动画 技术 人 





5.1 计算 机 动画 


许多 人 童年 时 代 所 看 过 的 动画 片 中 的 某 些 情节 至 今 可 能 还 记忆 犹 新 ， 世 界 许 多 国家 虽然 
语言 、 文 字 不 同 ， 文 化 背景 各 异 ， 但 人 们 对 动画 片 的 喜爱 却 是 一 样 的 。 由 此 可 见 ， 动 画 这 种 
极 具 表 现 力 的 信息 表示 形式 受到 了 人 们 的 欢迎 。 当 我 们 学 习 这 部 分 内 容 的 时 候 不 禁 要 问 : 什 
么 是 动画 ? 动画 是 怎样 产生 的 ? 计算 机 动画 是 什么 ? 

一 般 地 讲 ， 动 画 是 一 种 产生 运动 图 像 的 过 程 。 事 实 上 ， 运 动 的 图 像 并 不 真正 运动 ， 任 何 
看 过 胶片 电影 的 人 就 会 知道 它 是 由 许多 静止 图 像 所 组 成 的 。 从 严格 的 科学 观点 来 看 ， 动 画 依 
赖 于 眼睛 的 结构 ， 当 物体 移动 快 于 一 个 特定 的 速率 时 (每 秒 18 一 24 次 )， 一 个 称 为 视觉 暂 留 的 
生理 现象 便 起 作用 ， 在 短暂 的 时 间 间 隔 尽 管 没 有 图 像 出 现 ， 但 脑子 里 仍 保留 上 一 幅 图 像 的 约 
TO 
幻觉 和 这 幅 图 像 结合 起 来 。 当 一 系列 的 图 像 序列 一 个 接 特定 的 极 小 时 间 间 隔 连 
续 出 现 ， 其 最 终 的 效果 便 是 一 个 连续 运动 的 图 像 ， 即 动 
i 
眼睛 图 像 的 数量 决定 了 景物 有 “闪烁 率 ”。 当 眼睛 一 图 像 帧 时 , 便 出 现 抖动 (Flicken)， 
这 是 因为 帧 与 帧 之 间 的 时 间 间 隔 太 长 。 和 的 3 用 的 电 有 有 用 24 多， 这 
ipa tr 内 个 速率 ， 通 常 不 可 见 抖动 感 。 电 视 不 同 的 制 
式 其 帧 率 略 有 不 同 ，NTSC 制式 30 趾 sRAL 和 SECAM I 25 帧 /s。 当 电影 在 电视 上 
播放 时 , 常 采用 补 帧 的 方法 ， 如 在 NTSG 制式 上 播放 ， 每 秒 应 补 `6 帧 ,通常 每 个 第 4 帧 播 两 次 。 

计算 机 动画 是 采用 计算 机 生成 一 系列 可 供 实时 演播 的 连续 面 面 的 一 种 技术 ， 即 通过 计算 
机 产生 可 视 运动 的 过 程 。 算 机 硬件 和 动画 制作 软件 的 不 同 ， 所 产生 的 动画 质量 和 用 途 
也 有 明显 的 区 别 ， 二 外 可 4 维 动画 和 三 维 动画 。 计算 机 动画 的 制作 过 程 与 影视 动画 有 村 
似 之 处 。 我 们 知道 卡通 动画 片 传统 地 是 等 开 一 一 幅 一 幅 画 出 来 的 ， 每 一 帧 的 图 案 与 上 一 帧 的 
图 案 有 细微 的 ? : 同 在 计算 机 动画 中 ， 尽 管 计算 机 也 面 出 不 同 的 帧 ， 但 在 大 多 数 情况 下 ， 动 
画 的 创作 人 员 只 要 画 出 开始 和 结束 帧 ， 计 算 机 将 由 软件 自动 产生 中 间 的 各 帧 。 在 全 计算 机 动 
画 中 ， 利 用 复杂 的 数学 公式 产生 最 终 的 图 片 。 这 些 公 式 对 一 个 内 容 广泛 的 数据 库 中 的 数据 进 
行 操作 ， 这 些 数据 定义 了 物体 存在 的 数学 空间 。 这 个 数据 库 由 端点 、 颜 色 、 明 暗 度 、 运 动 轨 
迹 等 构成 ， 对 于 真空 感 较 强 的 三 维 动画 将 涉及 三 维 变 换 、 阴 影 、 三 维 模 型 、 光 线 等 专门 的 计 
算 机 技术 。 

如 今 的 个 人 计算 机 已 完全 具备 制作 二 维 与 三 维 动画 的 能 力 。 除 了 可 用 计算 机 语言 的 绘图 
语句 画 出 各 类 图 案外 ， 有 许多 专业 的 动画 制作 软件 ， 如 二 维 动画 软件 Animator、Flash， 三 维 
动画 软件 3ds Max 等 。 这 些 内 容 在 本 书 的 后 续 章 节 中 都 将 会 有 更 详细 的 叙述 。 

计算 机 中 动画 的 原理 和 影视 动画 类 似 ， 也 是 由 若干 连续 的 帧 序列 组 成 的 ， 只 要 以 足够 高 
的 帧 率 显示 这 些 图 案 (一 般 24 帧 /s， 或 更 高 ) 就 会 在 计算 机 屏幕 上 呈现 出 连续 运动 的 画面 而 没 
有 抖动 感 。 图 5.1 给 出 了 一 匹 马 奔跑 1s 的 24 帧 图 案 。 

计算 机 动画 有 很 多 用 途 ， 它 可 辅助 制作 传统 的 卡通 动画 片 或 通过 对 三 维 空间 中 虚拟 摄像 
机 、 光 源 及 物体 的 变化 (形状 、 彩色 等 ) 和 运动 的 描述 ,逼真 地 模拟 客观 世界 中 真实 的 或 虚构 的 
三 维 场景 随时 间 演 变 的 过 程 。 
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人 区 天体 技 术 坟 芮 应 用 (第 之 版 ) 

















图 5.1 马 奔 跑 1s 的 各 种 不 同 姿势 

5.2 计算 机 动画 的 应 用 
计算 机 动画 的 应 用 十 分 广泛 ， 可 用 于 影视 领域 中 的 电影 特技 ， 动 画 片 制作 ， 片 头 制作 ， 
基于 虚拟 角色 的 电影 制作 等 ， 还 有 电视 广告 制作 ,教育 领域 中 的 辅助 教学 ， 教 育 软件 等 ， 科 





将 会 创建 各 种 幻想 游乐 园 。 目 前 ， 
动画 在 几 个 主要 方面 的 应 用 情况 % 
1， 在 电影 工业 中 的 应 用 


可 能 计算 机 动画 使 用 最 多 的 要 数 电影 了 
室 的 科学 家 Messrs Zajac 和 Knowtion 就 开始 于 这 方 1 





学 计算 可 视 化 ， 复 杂 系统 工程 中 动态 模拟 ;视觉 模拟 领域 中 的 作战 模拟 ， 
训练 驾驶 员 训 练 模拟 ; 此 外 有 娱乐 业 中 的 各 种 大 型 游戏 软件 ， 
计算 机 动画 已 渗透 到 社会 的 许多 方面 ， 





军事 
结合 ， 


下 面 将 介绍 计算 机 


尤其 是 与 虚拟 现实 技术 相 


正业 了 > 时 在 20 世纪 60 年 代 ， 两 位 来 自 贝 尔 实验 


i 的 尝试 ， 后 来 由 于 计算 机 图 形 学 方面 的 











进步 和 一 系列 图 形 输出 设备 的 推出 , 在 电影 界 开始 








近年 来 所 推出 的 影视 作品 中 的 动画 和 许多 特技 镜头 ， 
园 》 这 部 电影 的 读者 一 定 会 对 影片 中 那些 棚 棚 如 生 
所 示 。 它 能 和 演员 同 处 一 个 画面 ， 并 能 将 汽车 掀 翻 。 这 
制作 的 ， 





其 效果 达到 了 以 假 乱 真 的 程度 。 另 外 ， We 





计算 机 代替 手工 制作 动画 。 据 资料 显示 ， 
大 都 是 计算 机 的 杰作 。 看 过 《 侏 罗 纪 公 


的 、 





恐龙 记忆 犹 新 ， 
中 的 所 有 动画 镜头 全 是 


如 图 5.2 
:计算 机 
-部 许多 人 熟悉 的 科幻 影片 


个 影片 








在 影片 中 出 现 的 X 形 机 姻 的 战斗 机 ， 看 上 去 和 真实 








5.2 


《 侏 罗 纪 公 
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的 模型 没有 任何 区 别 。 


》 中 的 恐龙 


第 5 章 有 


RS Soborsn rn 


”多 媒体 计算 机 动画 技术 


利用 计算 机 动画 制作 电影 的 好 处 在 于 能 让 计算 机 控制 物体 的 运动 ， 无 需 重 构 每 一 步 。 这 
样 便 提高 了 真实 感 ， 并 且 降 低 了 制作 成 本 。 然 而 用 计算 机 制作 动画 也 需 较 长 的 时 间 ， 动 画 的 
质量 越 高 所 需 的 时 间 越 长 ， 因 为 其 中 将 涉及 许多 复杂 的 数学 计算 。 这 些 数学 公式 能 被 用 于 处 
理 景物 和 产生 带 有 特殊 效果 的 真实 感 的 图 像 。 时 至 今日 ， 计 算 机 图 形 学 和 计算 机 图 形 硬件 的 
发 展 已 取得 很 大 的 突破 ， 一 些 厂家 已 相继 推出 了 面向 动画 制作 和 图 像 处 理 的 图 形 工作 站 。 制 
作 动画 对 大 多 数 人 来 说 已 不 再 是 一 件 难事 。 然 而 ， 好 的 动画 设计 毕竟 还 需要 艺术 天 赋 ， 尤 其 
是 用 于 影视 艺术 的 动画 。 而 对 于 一 般 的 动画 制作 ， 现 在 的 软件 已 能 使 大 多 数 初 学 计算 机 的 人 
就 可 方便 地 制作 ， 其 过 程 基本 上 是 自动 的 。 

2. 在 教育 中 的 应 用 

计算 机 动画 在 教育 领域 中 的 应 用 有 着 光辉 灿烂 的 未 来 。 随 着 个 人 计算 机 的 不 断 普 及 ， 将 
会 有 越 来 越 多 的 课程 利用 计算 机 辅助 教学 。 而 在 计算 机 辅助 教学 中 动画 则 是 一 种 人 们 喜 闻 
ee by 利用 动画 可 以 演 
示 一 个 物理 定律 ， 说 明 一 个 化 学 反应 过 程 。 目 前 ， 我 国 已 计算 机 辅助 教学 软件 用 于 
幼儿 园 、 小 学 、 中 学 、 职 业 培训 乃至 大 学 ， 如 图 5.3- 

在 这 些 软 件 中 ,出 现 了 大 量 的 计算 机 动画 ， 学习 者 
es 
信息 和 动画 的 运动 过 程 ， 这 会 极 大 提高 学 
固 所 学 的 知识 。 例如， 有些 化 学 需 
定 的 时 间 (有 的 长 达 几 天 )， 
燃烧 等 危及 人 身 安全 的 情况 ;| 
量 的 实验 材料 。 而 利用 计 
只 需 在 计算 机 上 选择 

























































































































































料 、 步 骤 ， 计 算 机 便 态 地 模拟 实验 的 人 
得 给 击 反馈 信息 * 习 情况 ， os sans 图 5.3 计算 机 辅助 教学 软件 
机 屏幕 上 一 目 了 然 地 获得 实验 数据 。 在 教育 的 各 个 层次 与 


此 相似 的 例子 比比 此 是 ， 数 不 胜 数 。 

3.， 在 科学 研究 中 的 应 用 

动画 在 科学 研究 中 被 大 量 用 来 模拟 和 仿真 某 些 自然 现象 、 物 体 的 内 部 构造 及 其 运动 规律 。 

E 空 间 探测 领域 , 计算 机 动画 被 用 来 模拟 飞行 器 或 行星 的 运行 轨道 或 太空 中 的 某 些 自然 现象 。 

凡 看 过 卫星 发 射电 视 转播 的 人 都 还 记得 ， 在 卫星 发 射 中 心 的 控制 室 的 大 屏幕 上 能 动态 地 画 出 
卫星 的 运行 轨道 及 所 处 的 位 置 ， 使 控制 中 心 的 工作 人 员 一 目 了 然 。 这 便 是 计算 机 动画 所 起 的 
作用 。 当 卫星 发 射 后 ， 各 种 测量 仪器 将 测量 的 卫星 飞行 数据 源源 不 断 地 送 往 控制 中 心 的 计算 
机 中 ， 计 算 机 再 根据 这 些 数据 ， 准 确 、 及 时 地 在 屏幕 上 画 出 卫星 的 飞行 情况 。 

早 在 1986 年 1 月 由 美国 国家 航空 航天 局 (National Aeronautics and Space Administration， 

NASA) 发 射 的 先驱 者 和 旅行 者 空间 探测 器 的 探测 情况 被 由 喷气 推进 实验 室 的 科学 家 根据 所 接 
收 的 观察 数据 和 太空 的 自然 运动 法 则 来 动态 地 显示 在 计算 机 屏幕 上 。 美国 国家 航空 航天 局 的 科 
学 家 们 能 够 直观 地 了 解 太空 行星 特定 轨道 和 太空 中 观察 的 景色 , 就 好 像 科学 家 们 自己 乘坐 探测 
器 观察 的 那样 。 这 个 软件 还 允许 选择 观察 的 视角 ， 将 观察 点 放 在 探测 器 的 后 面 ， 这 样 可 以 看 到 
探测 器 也 可 以 看 到 行星 。 图 5.4 给 出 了 美国 旅行 者 号 火星 车 着 陆 火 星 表面 行走 的 动态 行 模拟 。 
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图 5.4 美国 旅行 者 号 火星 车 着 陆 火星 表面 息 行 的 模拟 图 
在 医学 研究 中 , 计算 机 动画 能 够 帮助 医生 和 研究 者 可 视 化 地 构造 特定 的 器 官 和 骨骼 结构 ， 
分 析 病 人 的 病症 ， 以 便 对 症 下 药 。 如 今 像 这 些 带 有 计算 机 动 曾 功 能 的 医疗 设备 在 一 些 大 的 医 
院 和 医学 研究 机 构 中 随处 可 见 。 a 
4 在 训练 模拟 中 的 应 用 NA 
计算 机 动画 也 可 用 于 训练 模拟 。 例 如 ， 在 运动 员 训练 中 ， 可 以 利用 计算 机 帮助 运动 员 改 
进 他 们 的 动作 。 如 一 个 运动 员 跑 步 时 , “计算 机 能 根据 捕获 的 图 像 数 据 ， 分 析 运 动员 训练 时 存 
在 的 问题 ， 给 出 相应 的 训练 建议 和 动作 要 求 ， 其 中 动作 的 要 求 也 由 计算 机 用 动画 产生 ， 运 动 
员 可 根据 计算 机 的 动画 演示 来 进行 动作 训练 ， 同 样 的 思想 可 用 半 游 泳 、 网 球 等 。 据 资料 显示 
采用 这 种 辅助 训练 系统 .对 纠正 运动 员 不 规范 的 动作 提高 运动 成 绩 有 很 大 的 帮助 。 
计算 机 动画 技术 在 飞行 模拟 器 的 设计 中 起 着 非常 重要 的 作用 。 该 技术 主要 用 来 实时 生 
成 具有 真实 感 的 周转 环境 图 像 ， 如 机 场 、 山 脉 和 云彩 等 。 此 时 ， 飞 行 员 驾 驶 舱 的 航 秀 成 为 计 
算 机 屏幕 ， 飞 行 员 的 飞行 控制 信息 转化 为 数字 信号 直接 输出 到 计算 机 程序 ， 进 而 模拟 飞机 的 
各 种 飞行 特征 。 飞 行 员 可 以 模拟 驾驶 飞机 进行 起 飞 、 着 沙 、 转 身 等 操作 ， 如 图 5.5 所 示 。 
























































5.5 ”飞行 模拟 器 


5. 在 工程 设计 中 的 应 用 

计算 机 辅助 设计 (CAD) 在 如 今 的 工程 界 已 不 再 是 一 个 新 的 名 词 了 ， 在 世界 许多 国家 有 大 
量 的 计算 机 用 于 工程 设计 , 如 今 的 CAD 软件 已 能 做 到 以 动态 形式 将 设计 结果 用 三 维 图 形 显示 
出 来 ， 如 图 5.6 所 示 。 例 如 ， 一 个 机 械 设 计 师 为 某 一 机 器 设计 了 一 个 部 件 后 ， 计 算 机 便 可 模 
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拟 这 个 部 件 的 真实 情况 ， 能 以 不 同 的 光洁 度 和 不 同 的 视 
角 显示 设计 结果 ; 如 果 是 一 组 配套 部 件 ， 还 能 够 显示 装 
配 过 程 。 
在 建筑 工程 中 ， 在 开始 施工 之 前 ， 就 提供 大 楼 的 建 
筑 模 型 能 有 助 于 防止 大 量 由 于 设计 方案 疏忽 所 引起 的 不 
良 结果 。 例 如 ， 当 一 座 大 楼 设计 完毕 ， 计 算 机 能 显示 这 
章 楼 房 的 模型 ， 同 时 计算 机 动画 还 能 模拟 这 幢 楼 房 对 周 
围 环境 的 影响 。 例 如 ， 能 动态 显示 太阳 升 起 时 ， 各 个 不 图 5.6 计算 机 辅助 设计 应 用 
司 时 刻 光 线 照 在 楼 房 窗子 上 的 情况 ， 各 个 不 同 角度 光线 
反射 情况 ， 如 果 反 射 的 光线 直接 影响 楼 房 入 口 处 ， 或 楼 房 边 马路 上 汽车 
产生 危险 ， 发 生 交 通 事故 等 )， 那 么 设计 师 们 将 根据 计算 机 动画 的 模拟 结果 ， 修 改 大 楼 的 设计 
方案 ， 调 整 大 楼 的 位 置 或 角度 。 
6， 在 艺术 和 广告 中 的 应 用 
计算 机 和 艺术 家 相 结合 无 疑 会 给 艺术 家 的 艺术 创作 提供 极 大 的 便利 和 许多 艺术 灵感 ， 计 
算 机 的 绘画 软件 能 提供 更 多 的 色彩 ， 并 提供 使 物体 更 具 真 实感 的 各 种 光照 模型 ， 且 用 计算 机 
作画 、 修 改 也 极为 方便 。 
在 广告 领域 ， a :大 有 用 武之 地 的 y 如今 各 类 电视 广告 在 各 种 节目 中 出 现 ， 而 
在 这 些 广 告 中 ， 有 相当 - 是 利用 计算 机 动画 来 制作 产生 的 。 如 今 某 些 专用 动画 软件 的 功 
艺术 和 所 人 区 而 对 使 用 者 的 要 求 很 低 ，, 只 要 略 懂 计 算 机 就 可 以 。 
计算 机 动画 除了 影视 广告 中 的 应 用 之 外 ， 在 各 类 信息 板 、 广告 牌 中 也 大 量 使 用 。 ee 
穿梭 在 繁华 闹市 或 暂 留 在 Pe 3 头 时 ， 到 处 可 见 五 颜 六 色 的 各 类 大 型 电子 广告 牌 ， 而 这 些 
告 牌 中 显示 的 各 种 文字 、 图 案 、 动 画 均 是 计算 机 的 杰作 。 图 5.7 为 计算 机 制作 的 汽车 广告 。 
























































图 5.7 计算 机 广告 动画 








5.3 ”计算 机 动画 的 分 类 





计算 机 动画 的 分 类 方法 有 多 种 ， 按 不 同 的 方法 有 不 同 的 分 类 。 按 生成 动画 的 方式 分 为 帧 
到 帧 动画 (Frame by Frame Animation)、 实时 动画 (Real Time Animation ); 按 运动 控制 方式 来 分 
有 关键 帧 动画 、 算 法 动画 、 基 于 物理 的 动画 ; 按 变化 的 性 质 又 可 分 为 运动 动画 (如 景物 位 置 发 
生 改 变 )、 更 新 动画 (如 光线 、 形 状 、 角 度 、 聚 售 发生 改变 )。 
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转 大 小 、 位 移 、 切 变 、 扭 曲 、 随 机 变换 、 色彩 改变 


一 光 这 条 牧 及 让 其 训 用 (第 2 县 ) 
1， 关 键 帧 动画 


关键 帧 动画 实际 上 是 基于 动画 设计 者 提供 的 一 组 画面 ( 即 关 键 帧 ), 自动 产生 
动画 技术 。 关 键 帧 动画 有 以 下 几 种 实现 方法 。 








中 间 帧 的 计算 






































(1) 基于 图 形 的 关键 帧 动画 , 它 是 通过 对 关键 帧 图 形 本 身 的 插值 获得 中 间 画 面 , 其 动画 形 
是 由 它们 的 项 点 刻画 的 。 运 动 由 给 定 的 关键 帧 规定 ， 每 一 个 关键 帧 由 一 系列 对 
上 顶点 的 值 构成 ， 中 间 帧 通过 对 两 关键 帧 中 对 应 顶点 施 以 插值 法 来 计算 ， 插 值 法 可 以 是 线性 


或 三 次 曲线 或 样 条 的 插值 ， 我 们 在 网 上 所 见 到 的 大 多 数 Flash 动画 都 是 此 类 动画 。 











点 于 该 关键 








(2) 参数 化 关键 帧 动画 ， 又 称 关键 一 变换 动画 。 可 以 这 样 认为 : 一 个 实体 是 




















型 的 参数 所 刻画 的 ， 动 画 设计 者 通过 规定 与 某 给 定时 间 相 适应 的 该 参数 模型 
产生 关键 帧 ， 然 后 对 这 些 值 按照 插值 法 进行 插值 ， 由 插值 后 的 参数 值 确定 动画 形体 的 各 中 
画面 的 最 终 图 形 。 伦 

2， 算 法 动画 SA 





构成 该 实体 








的 





参数 值 集合 





小 位 克 。 要 妆 、 机 、 随 要、 所有 二 SC :这 种 动画 中 ， 运 动 使 用 变换 表 (如 旋 

















算法 进行 控制 和 描述 ， 每 个 变换 


由 参数 定义 ， ee 0 常用 的 物理 定律 包括 运 


解 ) 来 定义 。 NS 


算 物 体 随时 间 运 动 和 变化 的 一 种 计算 机 动画 。 RK 


十 





动 学 定理 和 动力 学 定理 。 这 些 定理 可 以 使 用 


> 


3. 基于 物理 的 动画 1 


形式 定义 或 使 用 复杂 的 过 程 (如 微分 方程 的 


六 
基于 物理 的 动画 是 指 采用 下列 理 的 过 型， 二 用 于 约束 的 技术 来 推导 、 计 


基于 物理 的 造型 mit 入 模型 中 所 -并 允许 对 模型 的 行为 进行 数值 模拟 ， 使 其 模型 





行为 的 数值 模拟 相关 信息 ,并 入 模型 中 








ie fle ， 而 且 也 包含 行为 造型 信息 ， 它 将 与 其 行为 有 关 的 物理 
间 的 约束 关系 及 尖 候 与 


特性 、 形 体 


动画 的 运动 和 变化 的 控制 方法 中 引进 了 物理 推导 的 控制 方法 ， 使 产生 的 运动 在 物理 上 更 
准确 、 更 有 吸引 力 、 更 自然 。 


5.4 ”计算 机 动画 的 生成 


计算 机 动画 的 生成 过 程 一 般 包 括 以 下 几 个 步骤 。 
(1) 关键 帧 与 背景 的 绘制 及 其 输入 。 

(2) 中 间 帧 的 自动 生成 。 

(3) 前 景 与 背景 的 复合 。 

(4) 配音 

(5) 预演 (preview)， 编 辑 修改 。 

(6) 动画 输出 。 











采用 计算 机 所 生成 的 一 系列 画面 可 在 显示 屏 上 动态 演示 ， 也 可 记录 在 电影 胶片 上 或 转换 
成 视频 信息 输出 到 录像 带 上 。 


a4 
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仿 几 


5.4.1 二 维 动画 








我 们 已 经 知道 由 计算 机 制作 的 动画 画面 是 二 维 的 透视 效果 时 便 是 二 维 动画 。 二 维 动画 是 
计算 机 动画 中 的 一 种 最 简单 形式 ， 即 使 没有 专门 的 动画 软件 ， 利 用 已 有 的 计算 机 语言 (如 
PASCAL 语言 ) 也 能 产生 各 种 动画 效果 。 下 面 介绍 二 维 动画 的 一 般 实现 方法 。 

1. 字符 集 动 画 

在 任意 一 种 计算 机 中 都 提供 了 许多 字符 (如 字母 等 ) 符 号 、 图 符 等 ,我 们 把 这 些 称 为 字符 集 。 
利用 这 些 字符 集中 的 字符 或 自己 制造 一 些 图 符 ， 编 一 个 简单 的 小 程序 就 可 实现 二 维 动画 。 一 
般 在 动画 创作 中 ， 先 创作 关键 帧 。 例 如 ， 设 计 一 个 人 与 另 一 个 人 再 见 的 动画 ， 可 先 设计 两 幅 
关键 帧 ， 一 帧 是 将 手臂 伸 出 做 再 见 的 手势 ， 另 一 帧 将 手臂 放 回 原 处 的 图 案 。 为 了 使 运动 的 动 
作 流 畅 、 连 续 ， 往 往 在 两 个 关键 帧 之 间 还 要 补 上 许多 中 间 帧 。 利 用 计算 机 内 部 提供 的 字符 集 
就 可 以 设计 关键 帧 与 中 间 帧 。 假 设 要 设计 一 个 鸟 飞行 的 动画 ,“ 其 过 程 是 ， 首 先 选择 拼 成 鸟 飞 
行 时 各 种 姿势 图 案 的 字符 集 。 下 面 选择 下 列 4 个 字符 ， 其 点 阵 的 放大 图 如 图 5.8 所 示 。 


加 加 网 国 






























































































































































































































































图 5.8 字符 集 动画 
图 5.8 可 以 看 出 , 每 一 帧 由 3X5 个 字符 拼 成 , 将 这 4 个 帧 以 一 个 特定 的 顺序 循环 显示 ， 


























这 只 鸟 便 可 飞 起 来 了 ， 其 循环 的 序列 如 下 。 
帧 1 循环 开始 
帧 2 
帧 3 
帧 4 循环 的 中 间 点 
帧 3 
帧 2 
帧 1 循环 的 终点 ， 开 始 下 一 轮 循环 
帧 2 


由 于 上 述 原 因 ， 将 其 称 为 循环 动画 ， 这 是 动画 中 较 容易 实现 的 一 种 。 下 面 给 出 实现 该 动 
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西 的 类 Pascal 的 算法 描述 ， 读 者 很 容易 将 其 改写 成 其 他 程序 。 


以 上 给 出 的 程序 所 产生 的 动画 只 在 一 个 地 方 运动 , 如 果 要 使 这 只 鸟 沿 着 给 定 的 路 线 运动 ， 
如 沿 屏幕 对 角 线 或 水 平 运动 ， 可 每 次 修改 gotoxy 语句 中 的 屏幕 坐标 ， 在 新 的 图 形 显示 前 ， 将 
老 的 图 形 消去 (可 编 一 子 程序 ， 用 空格 字符 消去 原 图 形 )， 有 兴趣 的 读者 不 妨 上 机 一 试 。 当 然 ， 
也 可 自己 定义 字符 集 产 生动 画 。 








toe emer ean td Se 
入 人 计 各 机 曾 投 术 | 有 


2.， 图 形 动画 


在 二 维 动画 中 大 量 出 现 的 是 基于 图 的 动画 。 这 种 方法 产生 的 动画 将 比 用 字符 方式 产生 
动画 有 更 好 的 效果 。 一 般 在 个 人 计算 机 中 ， 若 不 用 专门 的 动画 软件 ， 用 某 一 种 计算 机 语言 
如 BASIC 语言 也 能 创作 动画 。 基 本 方法 是 ， 在 图 形 方式 下 ， 首 先 选择 某 种 色彩 ， 然 后 用 绘图 
语句 ， 如 DRAW、LINE、Circle 等 画图 ， 要 使 图 形 移动 ， 再 选 一 种 新 的 色彩 (往往 是 底 色 ) 将 
原 图 再 画 一 遍 ( 即 消去 原 图 ); 然后 ， 再 用 另 一 种 颜色 在 新 的 位 置 将 原 图 再 画 一 遍 ， 这 种 方式 对 
初学 者 来 说 容易 掌握 ， 但 速度 、 效 果 等 可 能 不 太 令 人 满意 。 用 该 方法 产生 动画 的 步骤 可 分 为 
以 下 几 步 。 

(1) 产生 运动 物体 。 

(2) 描述 运动 轨迹 。 

在 计算 动画 中 物体 运动 轨迹 (路 线 ) 的 描述 一 般 可 分 为 两 种 情况 ,对 于 有 规则 的 运动 则 可 以 
将 物体 的 运动 路 线 用 数学 公式 米 表 示 ( 如 回 、 直 线 、 昏 线 、 扫 物 线 等 六 如 图 5.9(e) 所 示 的 运动 
过 程 。 AAAN 
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(a) 描述 运动 辆 迹 区 \ Sb) 显示 运动 过 程 
X 、 

_ A 1 一 图 5.9 

而 对 于 无 规则 的 运动 ， 可 采用 坐标 组 来 晤 画 运动 规则 。 现 在 许多 专门 的 动画 软件 和 多 
媒体 著作 软件 作 如 ToolBook， 当 定 义 了 运动 物体 之 后 ， 可 用 鼠标 拖 动 该 运动 物体 在 屏幕 上 移 
动 ， 计 算 机 自动 记录 运动 路 径 的 平面 坐标 ， 并 能 按 设 定 的 路 线 使 物体 运动 。 
(3) 产生 运动 过 程 中 各 运动 物体 的 中 间 图 像 。 
计算 机 动画 过 程 中 ， 各 运动 物体 的 中 间 图 像 不 论 是 二 维 的 还 是 三 维 的 ， 都 可 以 通过 各 种 
数学 变换 ， 如 平移 、 旋 转 等 获得 ， 在 这 方面 已 有 相当 成 熟 的 图 形变 换算 法 和 软件 可 供 使 用 。 
而 对 于 一 些 简单 图 形 的 变换 ， 利 用 BASIC 语言 就 可 实现 。 
(4) 显示 运动 过 程 。 
由 本 章 开 头 部 分 所 述 的 动画 原理 可 知 ， 一 个 连续 的 运动 过 程 是 由 若干 幅 离散 的 图 形 组 成 
的 ， 只 要 以 一 定 的 速度 依次 显示 这 些 图 形 即 可 。 如 果 显 示 速 度 达 不 到 一 定 的 要 求 ， 就 会 出 现 
运动 不 连续 的 拌 动 感 。 动 画 显示 速度 除 受 计算 机 硬件 本 身 性 能 的 制约 外 ， 软 件 及 实现 方法 也 
起 着 重要 的 作用 。 为 了 提高 显示 速度 ， 常 采用 局 部 运动 的 方法 。 例如， 图 5.9(b) 要 产生 运动 效 
果 ， 可 有 3 种 处 理 方案 : 让 小 船 运动 ， 让 波浪 运动 ， 让 背景 山峰 向 后 运动 。 一 般 先 消去 原 运 
动物 体 ， 再 在 新 的 位 置 重新 显示 该 物体 。 如 今 这 一 过 程 在 专用 的 动画 软件 中 已 完全 由 计算 机 
自动 实现 ， 无 需 使 用 者 编写 程序 。 

3. 二 维 动画 软件 一 一 Flash 


Flash Professional 是 目前 最 为 流行 的 动画 制作 软件 。 由 Macromedia 公司 在 1996 年 推出 ， 
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电影 能 够 在 最 短 的 时 间 内 
就 像 一 部 多 变 的 电影 ， 页 


格外 美观 。 更 为 突出 的 是 ， 使 


这 休 技术 及 英 应 用 1 第 大 ) 
_ 现 被 Adobe 收购 。 自 Flash 2.0 公布 以 来 ， 历 经 3.x、4.x、5.x， 到 
” ”迅速 扩大 ， 现 已 发 展 成 为 迄今 流行 最 广 ， 兼 具 “ 网 页 动画 插件 ”与 “专业 动画 ”制作 功能 
动画 制作 软件 。Flash Professional 的 功能 具有 以 下 特点 。 
1) 多 媒体 电影 制作 工具 
Flash Professional 提供 了 大 量 的 适合 于 网 页 
设计 、 制 作 完 成 。 采 用 
面 中 的 文字 、 图 




















其 影响 


的 


Flash Professional, 








竺 点 的 新 技术 和 开发 工具 , 使 网 页 动画 和 交互 
Flash Professional 制作 出 的 网 页 ， 整 个 页 面 

















片 、 按 钮 、 菜 单 都 随 鼠 标 与 键盘 信息 而 变化 ， 显 得 
用 Flash Professional， 可 以 轻松 地 在 任意 两 帧 图 形 之 间 制 作 变形 


动画 。 另 外 ， 它 还 支持 WAV 和 AIFF 声音 文件 的 播放 ， 增 加 了 对 MP3 的 支持 ， 所 以 Flash 











Professional 能 够 制作 真正 的 网 上 电影 。 
2) 采用 矢量 图 形 技术 





Flash Professional 由 于 采用 矢量 图 形 技术 ， 所 以 制作 的 动画 

















讼 作 很 小 ， 如 一 个 Flash 


Professional 制作 的 包含 动画 和 声音 的 几 十 秒 视频 动画 ， 往 和 共有 让 生字 节 大 小 。 
3) 运用 了 流 技术 < 
从 浏览 者 的 角度 看 , Flash Professional 动画 是 边 不 裁 边 演示 的 , 因此 , 如 果 速 度 控制 得 好 
几乎 感觉 不 到 文件 的 下 载 过 程 。 SYS- 
4) 具有 非凡 的 交互 性 2 站 
Flash Professional 非凡 的 交互 性 使 得 采用 Flash 制作 的 网 页 效果 远 远 超出 了 HTML、 Java、 
9 的 播放 。 


ActiveX 制作 的 效果 ， 用 上 
5) 易于 学 习 
从 制作 的 
效果 非凡 的 FF 


三 维 动画 人 < 人 ~ 
1. 三 维 动 


‘ 








5.4.2 


H 
纸张 等 建立 各 利 


或 
型 
若 











平 
表示 方式 被 大 量 用 
随 着 计算 机 技 


x 














于 工程 


角度 说 ， Flash Pro 
lash 动画 。 入 时 


要 修改 必须 花费 大 量 的 劳动 。 


术 的 进步 和 计 


的 发 展 和 应 用 
日 于 三 维 动画 的 表现 形式 更 加 直观 ， 早 期 人 们 为 了 创作 三 维 动画 ， 不 得 不 
各 样 的 三 维 模型 ， 再 设法 使 其 运动 。 然 而 ， 在 现实 世界 中 建立 一 个 三 维 模 
需 具 有 一 定 的 专业 技能 ， 并 且 建 立 模型 的 过 程 是 一 件 令 人 乏味 的 事 ， 一 个 模型 一 旦 建立 ， 
人 类 为 了 方便 地 交流 信息 ， 更 多 的 是 将 这 些 三 维 物体 在 一 个 
上 (如 纸 上 ) 表 示 。 如 今 即 使 一 个 最 复杂 的 三 维 结构 也 能 被 以 二 维 形式 表示 出 来 ,并 且 这 种 


设计 和 影视 动画 。 


OR ED i 
和 | x~X\\ 


| 算 机 图 形 学 的 发 展 ， 特 别 是 微型 计算 机 的 迅速 普及 ， 





fssional 简单 易学 , 用户 可 以 很 轻松 地 掌握 Flash， 并 制作 出 


NX 
NS 














木头 、 泥 土 








己 有 越 











来 越 多 的 人 感受 到 
作 。 如 今 设计 工程 是 











计算 机 制 人 
和 们 能 够 利 / 








自动 画 出 该 模型 的 各 种 图 











各 种 
设计 师 能 够 在 计算 机 - 
所 希望 的 视角 来 观察 ， 




















计算 机 辅 
纸 ， 并 能 获得 用 3 


上 产生 其 设计 的 建筑 模型 ， 能 够 “进入 ”计算 机 
也 能 快速 、 容 易 地 修改 计算 机 产生 的 模型 ， 并 能 为 模型 选择 建 


FE 三 维 模 型 和 动画 的 优越 性 。 首 先 获 利 


的 是 工程 设计 和 影视 制 
功 设计 (CAD) 系 统 方便 地 建立 设计 模型 ， 让 计算 机 
其 他 物理 模型 都 无 法 获得 的 视觉 效果 。 例 如 ， 建 筑 
产生 的 房子 ， 从 居住 者 
筑 材料 。 





计算 机 三 维 动画 也 给 影视 业 制作 注入 了 新 的 活力 。 使 用 计算 机 人 们 能 够 较 容易 地 创作 各 





种 动画 角色 和 特 


iss 


技 效果 ， 
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现 有 的 视频 技术 能 使 计算 机 动画 产 和 











E 的 角色 和 许多 著名 影星 同 


区 天 条 计划 新 芭 关 技 和 | 
场 演出 ， 目 前 已 出 现 了 计算 机 “演员 ”， 如 图 5.10 所 示 的 《玩具 总 动员 》 中 的 动画 角 
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图 5.10 《玩具 总 动员 》 中 的 动画 角色 
正如 我 们 所 知道 的 那样 ， 动 画 是 一 种 基于 时 间 、 空 间 的 媒体 。 企 由 于 这 些 ， 计 算 机 三 维 
动画 能 让 我 们 自主 地 控制 自己 的 信息 空间 。 利 用 动画 外 够 在 邢 秒 内 有 效 地 显示 - -个 长 的 时 间 
过 程 (如 土壤 的 分 化 ); 相反 ,为 了 便于 理解 - 些 阴间 即 四 的 事件 发 生 过 各 利用 动画 可 减 慢 其 
发 生 过 程 ， 让 它 在 5 一 10s 内 发 生 。 


2， 建立 三 维 动画 


早期 在 计算 机 上 建立 三 维 动画 条 用 二 上 -种 计算 机 语言 编写 程序 实现 的 ， 这 需要 有 较 高 

的 计算 机 、 数 学 和 艺术 素 oa 和 般 用 户 而 言 ， 没 有 必要 从 

基础 做 起 ， 因 为 如 仿 在 各 闫 计算 机 上 已 有 足 够 多 的 三 维 动画 软件 或 工具 供 选择 。 用 这 些 软件 
并 三 维 动画 一 般 来 说 有 5 个 基本 的 步骤 ， 这 对 大 多 数 软件 包 而 言 是 共同 的 ， 无 需 考虑 正在 

使 的 计算 机 平台 。 这 5 站 基本 步骤 如 下 。 从 

(1) 建立 一 

(2) 应 用 

(3) 加 入 光线 和 摄像 机 。 

(4) 使 物体 移动 。 

(5) 表演 。 

下 面 就 详细 地 看 一 下 这 些 步骤 。 

1) 建立 三 维 模型 

在 一 个 典型 的 三 维 建 模 软件 中 ， 有 多 种 方法 构造 一 个 三 维 模型 。 第 一 种 方法 ， 建 模 对 象 

从 一 些 原始 的 物体 中 产生 ， 或 从 像 立方 体 、 球 体 、 锥 体 、 圆 柱 这 样 简单 的 三 维 模型 中 产生 。 

实 上 ， 现 实 世界 有 许多 物体 和 这 些 物 体 是 相似 的 。 例 如 ， 一 张 桌子 通常 是 由 4 个 圆柱 和 1 

长 方 体 组 成 的 。 
第 二 种 方法 是 由 二 维 轮廓 线 来 构造 三 维 物体 。 例 如 

一 个 酒杯 的 断面 能 够 旋转 360° 形 成 一 个 三 维 的 高 脚 杯 ， 

如 图 5.11 所 示 。 相 似 地 ， 一 根 香 燕 能 由 一 个 圆 沿 着 一 段 = 

弧 增 大 或 减少 其 圆周 时 形成 。 

此 外 , 在 现在 的 一 些 三 维 软件 包 中 已 预先 设置 了 许多 

常用 的 三 维 物体 , 这 些 三 维 物体 的 原始 模型 往往 是 用 计算 

机 辅助 设计 软件 建立 的 , 它们 被 存储 在 一 个 标准 的 数据 交 图 5.11 用 二 维 轮廓 构造 三 维 图 物体 
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A 


提供 三 





多 媒体 技术 及 其 应 用 (第 2 版 ) 





er 国外 的 某 些 公司 ， 如 Viewpoint Engineering， 现 在 专门 为 多 媒体 开发 者 
三 维 模型 。 他 们 能 够 按照 用 户 提供 的 真实 物体 数字 化 的 要 求 来 数字 化 真实 世界 中 的 物体 。 




















2) 应 用 逼真 的 材料 




















一 旦 一 个 几何 形状 已 经 获得 或 建立 ， 建 立 动画 的 下 一 步 便 是 在 实景 中 用 材料 附 于 物体 表 





























的 是 


强大 
料 ， 

















并 提供 一 个 材料 编辑 器 ， 用 于 创立 或 修改 材料 。 


指定 一 种 材料 最 基本 的 方法 是 指定 其 颜色 特性 ， 如 物体 的 反光 强度 。 通 常 颜色 特性 利用 


。 例 如 ， 桌 面 能 用 灰色 大 理 石 来 装饰 ， 而 椅子 则 可 选用 一 种 橡木 材料 来 装饰 。 这 样 做 的 目 
使 物体 更 具有 真实 感 。 而 有 时 材料 的 选用 目的 并 不 是 为 了 使 景物 看 上 去 更 真实 ， 而 是 其 
看 上 去 更 具 幻 想 和 有 趣 。 在 计算 机 中 ， 将 各 种 材料 特性 赋予 任何 物体 的 能 力 是 三 维 动画 功能 
的 方面 之 一 。 通 常 ， 三 维 计算 机 动画 软件 包括 一 个 内 部 建立 的 材料 库 ， 库 中 存 有 多 种 材 





光 的 3 属性 来 说 明 ， 分 别 是 扩散 (Diffuse)、 泽 (Specular) 和 环境 (Ambient)。 扩散 分 量 是 指 物体 
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“光泽 ” 量 是 指 物体 表 GE eg Bd 


的 颜色 。 例 如 ， 有 一 个 球体 ， 若 给 扩散 分 量 赋 上 红颜 色 ， 便 能 模拟 一 个 红色 
































就 像 玻璃 的 了 。 








便 可 将 一 个 小 的 白色 的 强 光 点 赋 在 这 个 材料 上 ， 这 样 球 的 








是 指 它 在 实景 中 周围 的 光线 。 
an Map)。 例 如 ， 假 设 现 已 建立 
模型 ， 若 要 说 明 该 车 是 救护 车 ， 则 


的 塑料 球 。 
玻璃 做 成 
通过 改变 


属 或 橡胶 等 做 成 的 “周围 环境 ” 


了 一 辆 汽 


法 是 将 一 个 带 有 红 十 字 标记 的 特征 图 放 在 汽 


特征 图 是 一 种 简单 的 位 图 ， 可 绘图 程序 产生 或 扫描 到 计算 机 中 。 若 想 在 计算 
产生 一 个 地 毯 ， 则 可 先 提 措 一 个 样板 输入 计算 机 然后 将 用 于 村 型 地 面 的 区 人 村 
特征 图 能 够 用 作物 体 的 底 或 按 一 定 的 比例 来 应 六 例如 如 果 将 一 块 大 理 石 特征 图 放 在 
erat 4 i 证 物体 看 上 去 更 复杂 ， 就 像 一 团 变幻 






































的 浓 雾 一 样 。 AN 


日 于 模拟 Dp 面 区 域 的 升 高 或 降低 ， 所 以 其 结果 看 上 去 像 是 粒状 的 不 光滑 。 
创作 一 个 物体 表面 最 高 级 的 方法 之 一 是 利用 一 个 称 为 Shader 的 可 编程 过 程 。 因 














特征 图 也 能 以 全 种 积 为 六 笑 图 的 技术 被 全 这 时 的 特征 图 的 


为 许多 普 











料 ， 如 大 理 石 、 木 头 和 砖 等 ， 利 用 计算 机 算法 都 能 有 效 地 实现 ， 它 比特 征 图 更 




















的 磁盘 空间 就 越 大 。 
3) 加 入 光线 和 摄像 机 


具 真 实感 。 
在 一 个 动画 场景 中 ， 可 以 利用 软件 为 各 物体 广泛 地 选择 材料 ， 但 材料 选择 得 越 多 ， 数 据 


为 了 使 物体 更 具有 真实 感 和 达到 特殊 的 修饰 效果 ， 必 须 为 已 建 好 的 模型 加 入 光线 和 摄像 














照 的 位 置 。 使 用 聚光灯 一 般 能 在 物体 的 后 面 


机 。 就 像 在 现实 世界 中 一 样 ， 光 在 不 同 的 位 置 照 在 物体 
上 其 反射 的 程度 和 效果 是 不 一 样 的 。 图 5.12 给 出 了 加 入 
光线 和 摄像 机 后 的 显示 效果 。 如 今 在 大 多 数 动画 软件 中 ， 
设 有 许多 不 同 种 类 的 光线 ， 就 像 每 天 在 我 们 周围 
自然 光线 一 样 。 例 如 ， 聚 光 灯 常 被 用 来 在 一 个 特定 的 方 
向 上 发 送 锥 形 光线 ， 我 们 可 以 决定 锥 形 光线 的 大 小 和 光 











的 各 种 








生 阴 影 。 








这 通常 是 与 聚光灯 相 联系 的 另 一 个 参数 ， 聚 光 灯 在 三 维 
12 加 入 光线 和 摄像 机 的 效果 图 。 动画 中 是 一 个 想象 中 的 光源 ， 在 实际 场合 中 是 看 不 到 的 ， 


入 休 计 和 村 芒 投亲 | et 

只 能 从 物体 表面 的 反光 程度 和 物体 的 阴影 感受 到 它 的 存在 。 

大 多 数 三 维 动画 软件 包 也 含有 一 个 自动 摄像 机 ， 我 们 可 将 其 设置 在 场景 中 的 不 同位 置 。 
该 功能 实际 上 是 让 人 们 从 各 个 不 同 的 角度 来 观察 场景 和 场景 中 的 物体 。 

4) 表演 

完成 了 上 述 3 步 之 后 ， 为 了 查看 创作 的 模型 和 场景 的 实际 效果 ， 便 可 进行 第 四 步 一 一 表 
演 。 这 时 可 利用 软件 将 其 中 的 摄像 机 移 到 期 望 的 位 置 ， 然 后 显示 一 个 单 景物 。 表 演 实 际 上 是 
计算 机 化 的 处 理 过 程 ， 这 意味 着 计算 机 需要 花费 一 定 的 时 间 为 其 服务 。 因 此 ， 表 演 的 速度 受 
到 许多 因素 的 制约 。 
在 软件 中 有 几 种 不 同 级 别 的 表演 。 就 表演 速度 而 言 ， 最 简单 且 最 快速 的 渐变 方法 是 “ 单 
调 渐变 ”(Flat Shading)， 事 实 上 ， 某 些 计算 机 能 用 硬件 完成 模型 小 到 中 的 瞬间 渐变 。 但 是 一 
个 单调 渐变 表演 给 人 的 感觉 是 很 差 的 ， 每 一 多 边 形 被 赋 上 单一 的 颜色 ， 其 结果 常常 使 人 看 上 
去 像 假 的 。 单 调 渐变 常用 在 电影 的 先期 制作 和 时 装 款式 的 开发 中 4 

渐变 技术 的 高 一 级 别 是 平滑 渐变 (Smooth Shading)， i 克服 了 单调 渐变 在 物 
体 表面 颜色 上 单调 刻板 ， 不 是 每 一 面 只 有 一 种 颜色 ， 而 可 以 种 颜色 ， 以 产生 平滑 的 表 
现 效果 ， 但 这 将 要 多 花费 一 些 计算 时 间 ， 因 而 显示 的 时 间 也 相应 加 长 。 还 有 其 他 形式 的 渐变 
方法 ， 但 限于 目前 微型 计算 机 的 计算 速度 ， 要 用 其 制作 帧 动画 ， 需 要 太 长 的 时 间 ， 以 致 不 
太 容 易 实现 ， 如 象 鼻 卷 动 梨子 的 动画 目前 未 实 ' 必 






























































5) 使 物体 移动 人 
人 
该 考虑 怎样 使 它 运动 。 We > XX) 

在 二 维 动画 的 情况 下 ， 下 如 前 面 所 说 的 ， 我 们 可 用 传统 的 方法 画 出 每 一 个 帧 面 。 在 每 个 
帧 面 中 ， 运 动物 位 置 略 有 焉 同 ， 一 般 说 来 ， 观 察 是 固定 的 ， 物 体 在 前 面 移动 。 而 三 维 动画 ， 
其 过 程 稍 有 不 同 。 目 前 使 用 最 多 的 是 一 种 称 为 关键 帧 的 动画 实现 技术 。 关 键 帧 动画 被 定义 为 
这 样 一 个 过 程 :指派 特定 数量 帧 面 的 物体 下 让 其 运动 。 这 些 帧 面 构成 了 一 个 动画 序列 。 例 如 ， 
在 第 30 帧 上 设置 了 -个 球 抛 向 空中 的 位 置 ， 并 建立 了 一 个 关键 帧 ， 则 计算 机 将 平滑 地 条 动 这 
个 球 从 0 帧 到 30 帧 。 这 个 球 移动 轨迹 的 光滑 程度 可 通过 软件 设置 。 

通常 在 完成 关键 帧 动画 时 ， 现 在 的 软件 能 帮助 我 们 建立 物体 之 间 的 某 种 联系 ， 以 使 得 当 
一 个 物体 运动 时 ， 与 它 相 联系 的 物体 也 发 生变 化 。 例 如 ， 可 将 手 与 臂 建立 联系 ， 使 得 臂 移动 
时 ， 手 也 随 着 移动 。 

在 交互 式 图 形 系统 中 ， 一 般 常用 关键 帧 技术 产生 动画 。 在 这 类 系统 中 ， 可 用 鼠标 和 其 他 
设备 移动 关键 帧 中 的 物体 。 在 辅助 动画 设计 方面 ， 计 算 机 软件 做 得 越 来 越 好 。 在 某 些 情况 下 
特定 物体 的 属性 能 被 编程。 在 一 些 像 3D Studio 这 样 的 专业 动画 制作 软件 中 ,飞机 能 自动 地 围 
绕 跑道 倾斜 行进 。 一 个 球 无 需 人 工 关 键 帧 也 能 设置 成 上 下 弹跳 ， 甚 至 波 和 涟 涝 在 目前 的 动画 
制作 软件 中 也 能 自动 实现 。 

总 的 说 来 ， 三 维 动画 的 产生 过 程 可 以 是 简单 的 也 可 以 是 复杂 的 ， 这 不 仅 与 所 采用 的 软件 
及 运动 物体 的 复杂 程度 有 关 ， 还 与 计算 机 动画 的 相关 技术 (如 造型 技术 、 图 像 绘制 技术 、 运 动 
控制 和 描述 技术 、 图 像 编辑 与 合成 技术 、 特 殊 视 觉 效果 生成 技术 等 ) 有 关 。 


5.4.3 ”三 维 动画 制作 软件 一 一 3ds Max 
3ds Max 全 称 为 3D Studio Max， 是 Autodesk 公司 开发 的 三 维 动画 泻 染 和 制作 软件 。3ds 
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政史 并 体 找 坟 肥 其 应 用 第 之 服 ) 

















Max 广泛 应 用 于 广告 、 影 视 、 工 业 设 计 、 建 筑 设计 、 多 媒体 制作 、 游 戏 、 辅 助教 学 ， 以 及 工 


程 可 视 化 等 领域 。 

3ds Max 为 方便 、 快 捷 制 作 模型 和 纹理 、 角 色 动 画 及 更 高 品质 的 图 像 提供 了 许多 新 技术 。 
建 模 与 纹理 工具 集 的 巨大 改进 可 通过 新 的 前 后 关联 的 用 户 界面 调用 ， 有 助 于 加 快 日 常 工作 流 
程 ， 而 非 破坏 性 的 Containers 分 层 编辑 可 促进 并 行 协作 。 同 时 ， 用 于 制作 、 管 理 和 动画 角色 
的 完全 集成 的 高 性 能 工具 集 可 帮助 快速 呈现 棚 棚 如 生 的 场景 。 而 且 ， 借 助 新 的 基于 节点 的 材 
质 编辑 器 、 高 质量 硬件 泻 染 器 、 纹 理 贴图 与 材质 的 视 口 内 显示 及 全 功能 的 HDR 合成 器 ， 能 
够 轻松 制作 炫目 的 写实 图 像 。 

1.3ds Max 的 特色 


(1) 软件 结构 十 分 完整 ,从 平面 造型 到 立体 造型 及 立体 编辑 工具 ,甚至 动画 画面 的 产生 与 
素材 的 编辑 ， 都 完整 地 包含 在 一 套 软件 之 中 。 r 

(2) 与 AutoCAD 及 Animator Pro 软件 相 兼 容 。 原 来 各 行 各 业 4 资料 都 可 以 送 入 3ds Max 
中 处 理 ， 如 建筑 业 的 AutoCAD 文件 .dwg)， 可 由 DXFOUT 指 令 转 换 成 .dxf 格式 以 供 3ds Max 
读 取 ， 而 原先 由 Animator Pro 所 做 的 公司 简介 或 广告 等 也 可 以 送 入 3ds Max 做 贴图 处 理 ， 
呈现 美观 的 立体 效果 。 A 

(3) 由 于 3ds Max 使 用 普遍 ， op 与 






















































































Microsoft 的 .avi 视频 文件 成 为 多 媒体 世界 的 宠儿 ,- 使 得 各 多 媒体 展示 与 简报 软件 纷纷 加 入 这 
几 种 文件 格式 的 播放 功能 ， WE 动画 软件 也 加 入 了 这 种 文件 格式 。 
NAN 


2. 3ds Max 的 组 成 Sx XI 
3ds Max 有 以 下 5 个 功能 模块 和 ,多 
1) 建 模 (Modeling Object Ww 一 


3ds Max 的 重要 特点 是 有 一 个 集成 的 建 相 环 坟 , 可 以 在 同一 个 工作 空间 完成 从 图 纸 、 三 
维 建 模 及 制作 动画 的 全 部 工作 。 建 模 、 编 辑 和 动画 工具 都 可 以 在 命令 面板 和 工具 栏 上 找到 。 
3ds Max 是 关 建 模 、 动 画 和 泻 染 的 新 的 解决 方案 。 该 软件 能 够 有 效 解 决 由 于 不 断 增长 的 
3D 工作 流程 的 复杂 性 对 数据 管理 、 角 色 动 画 及 其 速度 /性 能 提升 的 要 求 ， 是 目前 业界 帮助 客 
户 实现 游戏 开发 、 电 影 和 视频 制作 ， 以 及 可 视 化 设计 中 三 维 创 意 的 最 受 欢 迎 的 软件 。 该 软件 
含有 如 高 级 的 角色 工具 、 脚 本 特性 和 资源 管理 等 工具 。 

2) 材质 设计 (Material Design) 

3ds Max 在 一 个 浮动 的 窗口 中 提供 了 一 个 高 级 材质 编辑 器 , 可 通过 定义 表面 特征 层次 来 创 
建 真实 的 材质 。 表 面 特征 可 以 是 静态 材质 ， 在 需要 特殊 效果 时 也 可 以 产生 动画 材质 。3ds Max 
人 允许 进行 无 限量 贴图 混合 来 表现 超级 真实 的 材质 效果 ， 并 可 使 用 UV Pelt Mapping(UV 贴图 
具 )， 该 工具 可 基于 给 定 的 几何 表面 的 UV 坐标 快速 地 生成 精确 的 贴图 。 

3) 灯光 和 相机 (Lighting and Camera) 

创建 各 种 特性 的 灯光 是 为 了 照 亮 场景 。 灯 光 可 产生 投射 阴影 、 投 影 图 像 ， 也 可 以 创建 大 
气 光源 的 容积 光 效 果 。 

创建 的 相机 有 着 真实 相机 的 控制 器 ， 如 焦距 、 景 深 ,还 有 各 种 运动 控制 ， 如 推进 、 转 动 、 
平移 。 

4) 动画 (Animate) 

通过 单 击 Animate 按钮 ， 可 以 在 任意 时 间 使 场景 产生 动画 。 通 过 时 间 的 改变 及 对 场景 中 
对 象 参数 的 控制 即 可 产生 动画 。 
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还 可 以 通过 轨迹 视图 (Track View) 控 制 动 画 。 轨 迹 视 图 是 一 个 浮动 窗口 ， 可 用 于 编辑 关键 
帧 ， 建 立 动画 控制 器 或 编辑 运动 曲线 。 
在 角色 动画 方面 ， 从 3ds Max 开始 ， 采 用 了 全 新 的 IK 系统 ， 包 括 了 历史 无 关 和 历史 相关 
的 反 向 动力 学 算法 和 肢体 算法 ， 及 新 增 的 可 视 化 着 色 骨 骼 系统 (Volumetric shaded Bones)， 可 
进行 精确 的 蒙 皮 骨 架 匹 配 和 预览 及 变形 。 

5) 泻 染 (Rendering) 

3ds Max 泻 染 器 的 特征 包括 选择 性 的 光线 跟踪 、 分 析 性 抗 锯齿 、 运 动 模糊 、 容 积 光 、 环 境 
效果 和 新 加 入 的 动态 着 色 (Active Shade) 及 泻 染 元 素 (Render Elements)。 新 的 功能 将 提供 更 方便 
的 交互 式 演 染 控制 和 更 强大 的 泻 染 能 力 。 

3ds Max 还 支持 网 络 演 染 ， 如 果 计 算 机 接 入 网 络 可 将 泻 染 工 作 分 配 到 多 台 计 算 机 上 。 

3， 最 新 版 本 的 功能 与 优点 


由 于 3ds Max 具有 良好 的 三 维 动画 特性 ， 所 以 imi ns 维 动画 
制作 软件 之 一 。 目 前 最 新 版 本 为 3ds Max 2013， 它 具 有 以 Fo 能 愉 与 优点 。 

1) Slate 材质 编辑 器 

使 用 Slate 轻松 可 信和 本村 分类 和 Ae 的 基于 节点 的 编辑 器 可 以 大 大 改进 
ie 音 疯 的 结构 视图 框架 能 够 处 理 苛刻 的 制作 所 
需 的 大 量 材质 。 人 

2) Quicksilver 硬件 泻 染 器 RA + 

使 用 Quicksilver 可 更 便捷 地 制作 高保 丰 可 视 化 预 宅 < “动画 和 游戏 方面 的 营销 资料 。 
Quicksilver 是 一 种 创新 的 硬件 泻 染 器 可 快速 制作 高 品质 的 图 像 。 这 个 新 的 多 线程 演 染 引擎 
同时 使 用 CPU 和 GPU， 支持 alplia 和 过 缓冲 区 泻 染 元 素 ] [景深 ， 运动 模糊 ， 动 态 反 射 ， 区 域 、 
光度 学 、 环境 乏 断 和 间接 生 光 效果 及 精度 自 适应 明 影 上 图 并 能 以 大 于 屏幕 的 分 辩 率 进行 泻 
染 。 Sp2a 

3) Contaijieis ,i 个 

通过 能 让 用 户 在 引用 内 容 之 上 非 破 坏 性 地 添加 本 地 编辑 层 的 大 大 改进 的 Containers 工作 
流程 ， 更 高 效 地 进行 协作 。 通 过 并 行 工 作 满 足 紧张 的 最 后 时 限 要 求 ; 在 一 个 用 户 和 迭代 编辑 嵌 
套 的 未 锁定 方面 时 ， 另 一 个 用 户 可 以 继续 精 调 基本 数据 。 多 个 用 户 可 以 一 次 修改 同一 艇 套 的 
不 同 元 素 ， 且 防止 同时 编辑 同一 个 分 量 。 
4) 建 模 与 纹理 改进 
利用 扩展 Graphite 建 模 和 视 口 画布 工具 集 的 新 工具 ， 加 快 建 模 与 纹理 制作 任务 ， 用 于 在 
视 口内 进行 3D 绘画 和 纹理 编辑 的 修订 工具 集 , 使 用 对 象 笔 刷 进行 绘画 以 在 场景 内 创建 几何 体 
的 功能 ， 用 于 编辑 UVW 坐标 的 新 笔 刷 界 面 ， 以 及 用 于 扩展 边 循环 的 交互 式 工具 。 
5) 3ds Max 材质 的 视 口 显示 
利用 在 视 口 中 查看 大 部 分 3ds Max 纹理 贴图 与 材质 的 新 功能 ， 在 高 保 真 交互 式 显 示 环境 
中 开发 和 精 调 场景 ， 而 无 需 不 断 地 重新 泻 染 。 建 模 人 员 和 动画 设计 人 员 可 以 在 一 个 更 紧密 匹 
配 最 终 输出 的 环境 中 做 出 交互 式 决定 ， 从 而 帮助 减少 错误 并 改进 创造 性 故事 讲述 过 程 。 
6) 3ds Max Composite 
利用 3ds Max Composite 改进 演 染 传递 并 把 它们 融合 到 实 拍 镜头 中 : 基于 Autodesk Toxik 
技术 的 全 功能 、 高 性 能 HDR 合成 器 。3ds Max Composite 工具 集 整 合 了 抠 像 、 校 色 、 摄 像 机 
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_ 一 贴图 、 光 栅 与 矢量 绘画 、 基 于 样 条 的 变形 、 运 动 模糊 、 景 深 及 支持 立体 视 效 制作 的 工具 。 





7) 前 后 关联 的 直接 操纵 用 户 界面 
利用 新 的 前 后 关联 的 多 边 形 建 模 工具 用 户 界 面 ， 节 省 建 模 时 间 ， 当 用 户 始终 专注 于 当前 
的 创作 任务 ， 该 界面 可 以 使 用 户 不 必 把 鼠标 从 模型 移 开 。 建 模 人 员 可 以 交互 式 地 操纵 属性 ， 
直接 在 视 口 中 的 兴趣 点 输入 数值 ， 并 在 提交 修改 之 前 预览 结果 。 
8) CAT 集成 

使 用 角色 动画 工具 包 (CAT) 更 轻松 地 制作 和 管理 角色 ， 分 层 、 加 载 、 保 存 、 重 新 贴图 和 镜 
像 动 画 。CAT 现 已 完全 集成 在 3ds Max 之 中 ， 提 供 了 一 个 开 箱 即 用 的 高 级 搭建 和 动画 系统 。 
通过 其 便利 、 灵 活 的 工具 集 ， 动 画师 可 以 使 用 CAT 中 的 默认 设置 在 更 短 的 时 间 内 取得 高 质量 
的 结果 ， 或 者 为 更 苛刻 的 角色 设置 完全 自 定义 骨架 ， 以 加 入 任意 形态 、 翌 入 式 自 定义 行为 和 
程序 性 控制 器 。 

9) Ribbon 自 定义 

利用 可 自 定义 的 Ribbon 布局 ， 最 大 化 可 用 工作 空间 ， 并 专 本 工作 病 本 是 
义 的 功能 。 创 建 和 存储 个 性 化 用 户 界面 配置 ， eri 宏 脚 本 ， 并 能 轻 触 热 键 或 
按钮 切换 这 些 配 置 的 显示 。 

10) 支持 多 种 格式 文件 导入 BAN 

支持 从 多 种 建 模 软件 所 生成 的 格式 文件 Eye 如 Google SketchUp、 Autodesk Inventor 
等 软件 。 利 用 新 的 FBX 文件 链接 ， SS 从 Autodesk Revit Architecture 导入 的 文件 的 


更 新 。 
11) Autodesk 材质 库 RN > 
从 多 达 1 200 个 材质 模 极 市直 他] 选择 ， 更 精确 地 与 其 他 Autodesk 软件 交换 材质 。 
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5.5 计算 机 动画 运动 控制 方法 
Sa A 

运动 控制 轨 流 的 是 控制 和 描述 动画 形体 随时 间 而 运动 和 变化 的 运动 控制 模型 。 主 要 方 
法 有 运动 学 方法 、 物 理 推导 方法 、 随 机 方法 、 自 动 运 动 控制 方法 、 刺 激 一 响应 方法 、 行 为 规 
则 方法 等 。 
.运动 学 方法 
运动 学 方法 是 通过 几何 变换 (旋转 、 比 例 、 切 变 、 位 移 ) 来 描述 运动 的 。 在 运动 的 生成 中 并 
不 使 用 物体 的 物理 性 质 。 运 动 学 的 控制 包括 正 向 运动 学 和 逆向 运动 学 。 正 向 运动 学 通过 变换 
和 矩阵 对 运动 物体 进行 变换 映射 来 确定 点 的 位 置 ， 逆 向 运动 学 则 是 从 空间 某 些 特定 点 所 要 求 的 
终结 效果 确定 所 用 几何 变换 的 参数 。 可 见 ， 运 动 学 方法 是 一 种 传统 的 动画 技术 。 

2.， 物理 推导 方法 
物理 推导 方法 是 运用 物理 定律 推导 物体 的 运动 。 运 动 是 根据 物体 的 质量 、 惯 量 作 用 于 物 
体 上 的 内 部 和 外 部 的 力 、 力 矩 及 运动 环境 中 其 他 物理 性 质 来 计算 的 。 采 用 此 方法 ， 动 画 设计 
者 可 不 必 详细 规 定 其 运动 的 细节 ， 采 用 动力 学 作为 控制 技术 ， 并 建立 一 个 系统 ， 可 实现 以 最 
少 的 用 户 交 互 作用 产生 高 度 复杂 的 真实 运动 ， 能 逼真 地 模拟 自然 现象 ， 可 自动 反映 物体 对 内 
部 和 外 部 环境 的 约束 。 
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3， 随 机 方法 

随机 方法 是 在 造型 和 运动 过 程 中 使 用 随机 扰动 的 一 种 方法 。 它 与 分 维 造型 、 粒 子 系统 等 
方法 相 结合 ， 确 定 不 规则 的 随机 体 (如 云彩 、 火 焰 等 ) 的 运动 和 变化 。 

4， 自 动 运动 控制 方法 

自动 运动 控制 方法 是 基于 人 造 角色 ， 使 用 人 工 智能 、 机 器 人 技术 ， 在 任务 级 上 设计 并 有 
物理 定律 计算 运动 。 它 可 用 于 跟踪 实际 动作 ， 产 生 行为 动画 等 。 

5， 制 激 -响应 方法 

在 运动 生成 期 间 ， 考 虑 环境 的 相互 影响 ， 建 立 一 个 神经 控制 网 络 ， 从 对 象 的 传感器 接受 
输入 ， 由 神经 网 络 输出 激发 对 象 运动 。 采 用 此 方法 ， 可 生成 反映 人 面部 表情 的 愉快 与 忧愁 的 
运动 情况 等 。 公 

6， 行 为 规则 方法 4 
使 用 这 种 方法 ， 从 传感器 接受 输入 ， Ty Da 确定 每 步 
运动 要 执行 的 动作 。 例如， WF 中 ， 从 而 实时 产生 相应 的 (如 唐 老 鸭 ) 
各 种 动作 。 


















































5.6 动画 本 
| 了 党 
5.6.1 ”动画 语 r 


什么 是 动画 语言 i 程序 设计 语言 。 在 动画 语言 中 ， 运 
i te het dried 形体 部 件 的 时 态 关系 和 
运动 变量 显 式 地 由 程序 设计 语言 描述 。 动 画 语 言 适用 于 算法 控制 或 模拟 物理 过 程 的 运动 ， 其 
缺点 主要 是 动画 设计 者 在 完成 程序 设计 并 绘 出 整个 动画 之 前 ， 不 能 看 到 其 设计 结果 。 

基于 动画 描述 模型 开发 的 动画 语言 主要 有 以 下 3 类 。 

CD 线性 表 语言 ， 即 用 符号 表达 的 线性 表 来 描述 动画 功能 。 线 性 表 语言 简单 直观 ， 一 般 提 
供 编码 、 求 精 和 动画 过 程 ， 编 码 任务 可 通过 一 种 智能 的 记号 编辑 器 来 完成 。 

(2) 通用 语言 ,在 通用 程序 设计 语言 中 媒 入 动画 功能 是 一 种 常用 的 方法 , 语言 中 变量 的 值 
可 用 作 执行 动画 例 程 的 参数 ， 如 C 语言 及 C 十 十 中 也 开发 了 很 多 动画 语言 

(3) 图 形 语言 ， 它 支持 可 视 的 设计 方式 ， 以 可 视 化 的 方式 描述 、 编辑 修改 动画 功能 。 这 种 
语言 能 将 动画 中 场景 的 表示 、 编 辑 、 表 现 同时 显示 在 屏幕 上 。 


5.6.2 ”动画 的 传输 


动画 的 传输 主要 有 两 种 方式 : 一 是 以 符号 方式 表示 和 传输 动画 对 象 及 运动 命令 ;二 是 以 
位 图 图 像 方式 表示 和 传输 。 前 者 需 传输 的 数据 量 少 ， 接 收 端 需 花费 大 量 处 理 时 间 生 成 动画 ; 
后 者 需 传输 的 数据 量 大 ， 接 收 端 重 显 动画 所 需 处 理 的 工作 量 较 少 。 


5.6.3 ”计算 机 动画 的 发 展 趋势 
自从 贝尔 实验 室 于 1963 年 制作 了 第 一 部 计算 机 动画 片 以 来 , 计算 机 动画 技术 已 有 了 很 快 
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一 的 发 展 。 计 算 机 动画 的 研究 涉及 具有 人 的 意识 的 虚拟 角色 的 集成 动画 系统 。 研 究 内 容 不 仅 包 


含 动画 描述 模型 、 动 画 语言 、 运 动 控制 方法 ， 还 包括 关键 帧 的 生成 技术 、 三 维 动画 中 的 物体 
造型 技术 、 动 画 的 相关 技术 、 动 画 的 生成 与 绘制 技术 。 总 之 研究 内 容 涉及 多 种 学 科 的 知识 
技术 和 方法 ， 如 动画 、 力 学 、 机 器 人 技术 、 生 物 学 、 心 理学 和 人 工 智能 等 。 研 究 计算 机 动画 
所 要 实现 的 目标 : 能 自动 产生 计算 机 生成 的 虚拟 角色 一 一 人 的 自然 行为 ， 提 高 计算 机 动画 运 
动 的 复杂 性 和 真实 性 ;应 减少 运动 描述 的 复杂 性 ， 特 别 是 在 任务 级 上 进行 运动 的 描述 ， 从 而 
解决 制作 复杂 动画 的 很 多 难题 。 在 不 久 的 将 来 导演 可 在 视频 屏幕 前 ， 使 用 不 同 的 命令 来 导演 
虚拟 角色 、 灯 光 、 舞 台布 置 和 摄像 机 。 如 果 这 一 切 能 实时 完成 (前 提 为 计算 机 硬件 性 能 大 大 提 
高 ， 数 据 存储 设备 能 提供 足够 的 速度 和 容量 ， 软 件 所 能 实现 的 效果 不 至 于 受 计 算 机 时 间 和 空 
间 的 影响 ， 且 人 们 对 人 脑 和 人 类 行为 的 认识 基本 达到 了 一 定 的 各 入 ) 时 ;学 净 像 是 企 启 投 世 男 
里 导演 一 部 真实 的 影片 。 把 计算 机 动画 、 多 媒体 、 人 工 智能 等 多 种 技术 相 结 合 将 会 完善 虚拟 
环境 技术 ， 即 动画 技术 的 发 展 ， 会 促进 虚拟 现实 的 进 一 A 
从 而 真正 地 实现 虚拟 环境 系统 。 可 以 预见 J 人 类 的 生活 产生 重大 
的 影响 。 




































































5.7 Flash Professional ee 
水 

如 前 所 述 ，Flash Professional 是 Macibitedia A 公司 ( 现 被 Adobe 收购 ) 出 品 的 矢量 图 形 
编辑 和 动画 创作 的 软件 ， 它 与 该 公 司 推 则 的 Dreamweaver (网 页 设计 ) 和 Fireworks (图 像 处 理 ) 
组 成 了 网 页 制作 的 “三 剑客 ”而 Flash 则 被 誉 为 “内容 叶 > 

Flash Professional 动 面 是 再 几 闻 发 民 为 先后 上 序 排列 的 ~ -系列 编辑 帧 组 成 的 , 在 编辑 过 程 
中 , 除了 传统 的 “ 帧 - 帧 ”油画 变形 以 外 ， 还 支持 了 这: 变形 技术 , 包括 移动 变形 和 形状 变形 。 
“过 渡 变 形 ” 方 法 只 3 需 制作 出 动画 序列 中 的 第 二 : 帧 和 最 后 一 帧 (关键 帧 ), 中 间 的 过 渡 帧 可 通过 
Flash 计算 自动 生成 。 这 样 不 但 大 大 减少 动画 制作 的 工作 量 ， 缩 减 动画 文件 的 尺寸 ， 而 且 过 渡 
效果 非常 平滑 。 对 帧 序列 中 的 关键 帧 的 制作 ， 产 生 不 同 的 动画 和 交互 效果 。 播 放 时 也 是 以 时 
间 线 上 的 帧 序列 为 顺序 依次 进行 的 。 
Flash Professional 动画 与 其 他 电影 的 一 个 基本 区 别 是 具有 交互 性 。 交 互 是 通过 使 用 键盘 、 
鼠标 等 工具 , 可 以 在 作品 各 个 部 分 跳 转 , 使 受众 参与 其 中 。 从 制作 的 角度 说 , Flash Professional 
简单 易学 ， 用 户 可 以 很 轻松 地 掌握 Flash， 并 制作 出 效果 非凡 的 Flash 动画 。 


5.7.1 ”Flash Professional 的 启动 与 用 户 界面 

































































1，Flash Professional CS5 的 启动 

选择 “开始 ”一 “程序 ”一 “Adobe Flash Professional CS53” 选 项 ， 出 现 欢迎 界面 

2.，Flash Professional CS5 的 用 户 界面 

启动 Flash Professional CS5 后 ， 打 开 如 图 5.13 所 示 的 工作 界面 ， 熟 悉 该 工作 界面 的 构成 
是 正确 使 用 Flash Professional 的 基础 

1) 菜单 栏 

菜单 栏 包 含 除 绘图 命令 以 外 的 绝 大 多 数 Flash 命令 。 可 依次 选择 “文件 ” “编辑 ”、“ 查 看 ” 
等 菜单 ， 了 解 各 主 菜单 包含 的 子 菜单 。 
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时 间 轴 面板 AS 
图 5.13 Flash Propssina CS5 的 工作 界面 
2) 工具 箱 NE- 
工具 箱包 含 用 于 创建 、 放 置 和 人 改 灾 本 与 图 形 的 工具 江 它 位 于 窗口 的 左 便 ， 可 以 使 用 鼠 
标 将 其 拖 至 窗口 的 任意 位 置 .一 了- 0 Wx 
3) 浮动 面板 和 xT 
浮动 面板 是 指 可 以 在 窗口 在 意 位 置 移动 的 设 。 下 lash Professional CS5 中 除了 工作 区 域 ， 
et 该 版 本 对 某 进行 了 改进 (如 时 间 轴 面板 、 调 色 板 面板 )， 并 
且 新 增 了 一 些 属性 面板 、 组 件 面板 、 组件 选项 面板 等 )。 
4) 时 间 和 表 
时 间 轴 用 于 组 织 和 控制 影片 内 容 在 一 定时 间 内 播放 的 层 数 和 帧 数 。 时 间 轴 面板 位 于 标准 
工具 栏 下 方 ， 如 图 5.14 所 示 。 选 择 “ 窗 口 ” 一 “时 间 轴 ”选项 ， 可 打开 或 关闭 时 间 轴 面板 。 


播放 头 





可 可可 本 人 i wu ee We 
图 5.14 时间 轴 面板 
时 间 轴 的 各 组 成 部 分 如 下 。 
(1) 时 间 轴 的 主要 组 件 是 图 层 和 帧 。 与 胶片 一 样 ，Flash 影片 也 将 时 长 分 为 帧 。 图 层 就 像 
层 登 在 一 起 的 约 灯 胶 片 一 样 ， 每 个 图 层 都 包含 一 个 显示 在 舞台 中 的 不 同 图 像 。 
(2) 文档 中 的 图 层 显示 在 时 间 轴 左 侧 的 列 中 。 每 个 图 层 中 包含 的 帧 显示 在 该 图 层 名 右 侧 的 
一 行 中 。 时 间 轴 顶部 的 时 间 轴 标题 显示 帧 编号 。 
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一 一 末节 ) 


的 底部 ， 它 
时 间 。 


缩 略 图 。 时 
补 间 动 画 和 运 

(5) 时 
图 层 及 将 图 





(3) 播放 头 指示 舞台 当前 显示 的 帧 , 时 间 轴 状态 显示 在 时 间 轴 


指示 所 选 的 帧 编号 、 当 前 帧 频 及 到 当前 帧 为 止 的 运行 





(4) 可 以 更 改 帧 的 显示 方式 , 也 可 以 在 时 间 轴 中 显示 帧 内 容 的 


间 轴 可 以 显示 影片 中 哪些 地 方 有 动画 ， 包 括 逐 帧 动画 
运动 路 径 。 

间 轴 的 图 层 部 分 中 的 控件 可 以 隐藏 或 显示 、 锁定 或 解锁 
层 内 容 显 示 为 轮廓。 


(6) 可 以 在 时 间 轴 中 插入 、 删 除 、 选 择 和 移动 帧 。 也 可 以 将 帧 














拖 到 同一 图 层 中 的 不 同位 置 ， 或 是 拖 到 不 同 的 图 层 中 。 
RE 5) 属性 面板 
站 Bn 属性 面板 是 Flash Professional CS5 新 增 的 面板 ， 它 集成 了 
去 :Flash 浮动 面板 中 的 常用 选项 。 当 在 工作 区 中 选取 某 一 对 象 或 在 给 
paoen 图 工具 栏 中 选择 某 些 工具 时 ，| 人 
例如 ， 单 击 





绘图 工具 栏 中 Ro 按钮 ， 屏 幕 下 方 即 显示 
图 5.15 文本 工具 属性 面板 SS 板 。 


6) 舞台 





和 是 创作 及 片 中 各 个 的 内 容 的 区 地/ > 会 图 ， 也 可 以 在 其 中 安 


排 导入 的 插图 ， 编 辑 和 显示 动画 ， 并 百 
5.7.2 ”利用 工具 箱 中 的 工具 画图 A 
Flash Professional 的 工 se ne 




















ea 


SS 
多 工具 按钮， Ma 工具 箱 由 工具 、 查 看 、 























颜色 和 选项 4 个 区 区 域 组 夫 着 项 区 用 于 显示 el en 当 用 户 选 择 不 
出 现 有志 人 


同 的 工具 时 ， 远 项 区 和 
单 图 形 ， 验 证 其 功能 





AN nr 


和 “可 分 别 选择 下 列 工具 ， 在 舞台 中 绘制 简 





任意 变形 工具 一 一 家 六 一 一 3D 旋转 工具 
套 索 工具 一 一 
钢笔 工具 一 一 向 外 一 一 文本 工具 
线条 工具 一 一 入 局 一 算 形 工具 
铅笔 工具 一 到 天 ”一 刷子 工具 
Deco 工 具 一 一 
骨骼 工具 史记 ”一 颜料 桶 工具 
滴 管 工具 一 一 其 思 -橡皮 擦 工具 
手 形 工具 一 一 过 有 一 一 缩放 工具 





立国 一 填充 颜色 工具 


黑白 工具 一 得 细 一 一 一 交换 颜色 工具 


粘贴 至 对 象 工具 一 一 可 二 
“~ 


5.16 ”Flash Professional CS5 工具 箱 面板 


1. 务 椭 贺 和 矩形 
(1) 选择 椭 
(2) 选择 矩形 了 
2. 画 线 

利用 线条 工具 、 铅 笔 
(1) 选择 线条 工具 , 在 
直线 或 45° 斜 线 。 
(2) 选择 铅笔 工具 ， 可 









































舞 





水 了 





具 ， 在 舞台 中 拖 放 鼠标 绘制 椭 
[ 具 ， 拖 放 鼠 标 绘制 矩形 。 














圆 。 若 按 住 Shift 键 拖 动 鼠标 则 绘制 了 
若 按 住 Shift 键 拖 动 鼠标 则 绘制 正方 形 。 











具 和 钢笔 工具 可 绘制 各 种 线条 。 
台中 拖 放 鼠标 可 绘制 直线 。 若 按 住 Shift 键 拖 动 鼠 标 则 绘制 于 


EE 直 、 





以 画 直 线 或 曲线 。 


(3) 选择 钢笔 工具 , 可 以 绘制 连续 线条 与 贝 塞 尔 曲线 , 且 绘 制 后 还 可 以 配合 
以 修改 。 用 钢笔 工具 绘制 的 不 规则 图 形 ， 可 以 选择 在 任何 时 候 重新 调整 。 
要 调整 所 画 的 图 形 ， 可 选择 图 5.16 中 的 “选择 工具 ”。 单 击 选择 工具 ， 在 了 
部 分 ， 可 根据 情况 在 工具 箱 部 分 选择 “ 贴 紧 至 对 象 `“ 平 











来 有 




















部 分 选取 了 


[ 具 








[有 具 箱 的 选项 





和 “ 伸 直 ”( 对 直线 和 形状 进行 平 直 处 理 )。 
3 选择 图 形 并 移动 


RR 线 和 形状 进行 平滑 处 理 ) 


< 








利用 工具 箱 中 的 部 分 选择 工具 、 套 索 工 


画 好 的 图 形 对 象 或 拖 放 鼠 标 使 其 移动 。 





(1) 选择 部 分 选取 工具 ， 用 拖 放 鼠标 
显示 出 一 条 带 有 节点 (小 方块 或 圆 ) 的 绿 
的 选项 栏 显示 “魔术 棒 ” 和 < 多 过 形 








汪 选中 圆 (或 正方 形 ) 对 象 后 ， 将 
若 单 击 套 索 工具 可 以 选择 不 规则 区 域 。 该 工具 
区 两 项 ， 








区 域 ， 使 用 多 边 形 本 ER 形 区 域 。 


3 oo 


度 和 中 心 位 置 等 。 
(1) 选择 椭圆 工具 和 填充 颜色 工具 ， 打 开颜 色 选 择 框 。 
(2) 选择 颜色 选择 框 的 底部 左 起 的 第 四 个 渐变 色 。 








ee 墨水 瓶 工具 和 颜料 桶 工具 。 
对 有 渐变 色 填 充 的 对 象 进行 操作 ， 改 变 



























































形 对 象 中 的 渐变 色 的 方向 、 


深 


(3) 在 舞台 绘制 一 个 有 渐变 色 的 圆 。 

(4) 选择 填充 变形 工具 , 再 单 击 上 述 有 渐变 色 的 圆 ， 该 圆 被 选中 , 并 显示 圆 和 正方 形 等 标记 。 

(5) 对 选取 的 圆 进 行 相关 操作 。 

墨水 瓶 工具 可 用 来 更 改线 条 的 颜色 和 样式 。 

颜料 桶 工具 可 用 来 更 改 填充 区 域 的 颜色 ， 操 作 步 又 如 下 。 

(1) 选择 颜料 桶 工具 ， 它 的 选项 栏 显 示 “ 空 隙 大 小 ”和 “锁定 填充 ”两 项 。 空 隙 大 小 决定 
如 何 处 理 未 完全 封闭 的 轮廓 ， 锁 定 填充 决定 Flash 填充 渐变 的 方式 。 











色 。 


(2) 选择 空隙 大 小 和 填充 颜色 ， 单 击 圆 或 顶 圆 ， 改 变 填充 颜 
(3) 单 击 锁定 填充 按钮 ， 再 选择 -种 填充 颜色 ， 依 次 单 击 圆 和 


5.， 图形 的 擦 除 
使 用 橡皮 擦 工 具 可 以 完整 或 部 分 地 擦 除 线条 、 填 充 及 形状 。 














E 方 形 ， 改 变 




















上 


其 填充 颜色 。 
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一 一 2) 


一 5.73 简单 动画 的 制作 





Flash 动画 只 包含 两 种 基本 的 动画 制作 方式 , 即 补 间 动画 和 逐 帧 动画 。Flash 生成 的 动画 文件 
的 扩展 名 默认 为 .fla 和 .swf。 前 者 只 能 在 Flash 环境 中 运行 ， 后 者 可 以 脱离 Flash 环境 独立 运行 。 








1， 补 间 动 画 


补 间 动 画 可 用 于 创建 随时 间 移 动 或 更 改 的 动画 ， 如 对 象 大 小 、 形 状 、 颜 色 、 
等 。 在 补 间 动 画 中 ,用 户 只 需 创建 起 始 和 结束 两 个 关键 帧 ， 而 中 间 的 帧 则 由 Flash 
动 生成 。 由 于 补 间 动 画 只 保存 帧 之 间 更 改 的 值 ， 因 此 可 以 有 效 地 减 小 生成 文件 的 

补 间 动 画 分 为 补 间 动 作 动画 和 补 间 形状 动画 两 种 ， 其 区 别 如 下 。 









































(1) 补 间 动 作 动画 。 在 改变 一 个 实例 、 组 或 文本 块 的 位 置 、 大 小 和 旋转 等 属性 时 ， 可 使 月 








补 间 动 作 动画 。 使 用 补 间 动 作 动 画 还 可 以 创建 沿路 径 运动 的 动画 。- 



































位 置 的 变化 
通过 计算 自 
大 小 。 

















(2) 补 间 形状 动画 。 在 改变 一 个 矢量 图 形 的 形状 、 颜 色 、 位 置 K 诬 使 一 个 矢量 图 形变 为 另 
一 个 矢量 图 形 时 ， 可 使 用 补 间 形 状 动画 。 AAA 
2， 逐 帧 动画 





逐 帧 动画 是 一 种 传统 的 动画 形式 ， 在 逐 帧 动画 1 一 帧 的 内 容 。 


于 逐 帧 动画 中 Flash 要 保存 每 个 帧 - tin Nm 画 方式 的 文件 通常 要 比 采用 补 间 
动画 的 文件 大 。 
逐 帧 动画 模拟 传统 卡通 片 的 逐 帧 绘 抽 不 仅 费 时 ， 而 且 要 求 用 户 具有 较 高 的 给 图 能 


力 。 补 间 动 画 则 不 然 ， 由 于 所 有 中 i 不 会 绘画 的 用 户 也 可 轻松 地 


























作出 形状 和 色彩 逐渐 变化 、 CO 意 的 动画 ， x 件 的 容量 也 较 逐 帧 动画 小 得 多 ， 


因而 更 适合 于 绘画 水 平 不 高 的 初学 者 使 用 。 


【 例 5.1】 利用 Plash rina CS5 we 4 动画， 显示 一 个 圆 变 为 矩形 的 过 程 。 


操作 步骤 如 下 5 


站 
(1) 运行 om CS5。 选 择 jf ” 一 “程序 ”一 “Adobe Professional CS5” 


选项 ， 打 开 其 运 


(2) 在 时 间 by 1 帧 处 , 选择 工具 箱 中 的 椭圆 工具 ， 并 在 填充 色 中 选择 绿色 渐变 色 ; 在 











场景 1 的 舞台 中 央 画 出 一 个 圆 ， 显 示 界 面 如 图 5.17 所 示 。 









orp 


Oy 
pF 











图 5.17 在 场景 1 的 舞台 中 央 画 一 个 圆 


“多 媒体 计算 机 动画 技术 | 。 一 多) 


(3) 在 第 30 帧 处 右 击 ， 在 弹出 的 快捷 菜单 中 选择 “插入 空白 关键 帧 ”选项 ， 选 择 工 具 箱 
中 的 矩形 工具 ， 并 在 填充 色 中 选择 红色 渐变 色 ; 在 场景 1 的 舞台 中 央 画 出 一 个 矩形 。 
(4) 在 第 1 帧 处 右 击 , 在 弹出 的 快捷 菜单 中 选择 “创建 补 间 形 状 ” 选 项 , 如 图 5.18 所 示 。 
(5) 按 Enter 键 ， 查 看 动画 效果 。 





















































(6) 选择 “文件 ”一 “保存 ”选项 ， 打 开 “ 另 存 为 ”对 话 框 ， 在 “文件 名 ”文本 框 中 输入 
“animitor1”， “保存 位 置 ”为 “C:\”， 单 击 “ 保 存 ” 按 钮 。 

【 例 5.2】 利用 Flash Professional CS5 创建 一 个 简单 运动 动画 ， 显示 一 只 小 鸡 从 树 下 走向 
小 屋 的 过 程 ， 如 图 5.19 所 示 。 

全 [ 本 和 











图 5.18 0 XX ”图 5.19 运动 动画 
操作 步骤 如 下 关 

(1) 运行 a CS5， 选择 修改” 一“ 文档” 选项， 打开“ 文档 属性 ”对 话 
框 ， 设 定 动画 的 类 处 为 500px X300px， 单 击 “ 确 定 ” 按 钮 。 

(2) 选择 “文件 ”一 “导入 ”一 “导入 到 有 舞台” 选项， 导入 文件 ， 背景 1jpg。 

(3) 在 时 间 轴 窗口 的 第 1 帧 处 ， 选 择 工具 箱 中 的 任意 变形 工具 地 ， 将 导入 图 片 调整 到 与 
舞台 同等 大 小 。 

(4) 在 图 层 1 的 第 50 帧 处 右 击 ， 在 弹出 的 快捷 菜单 中 选择 “插入 帧 ”选项 ， 使 图 片 在 动 
画 的 全 过 程 中 一 直 显示 。 

(5) 单 击 时 间 轴 面板 中 的 插入 图 层 按钮 ， 创 建 图 层 2。 

(6) 选中 图 层 2 中 的 第 1 帧 ， 选 择 “ 文 件 ” 一 “导入 ”一 “导入 到 舞台 ”选项 ， 导 入 文件 ; 
公鸡 1.bmp。 

(7) 选择 任意 变形 工具 ， 将 导入 图 片 调整 到 合适 的 大 小 。 

(8) 选择 “修改 ”一 “分 离 ” 选 项 ， 将 图 片 打 散 。 

(9) 选择 工具 箱 中 的 套 索 工 具 , 在 其 选项 栏 中 选择 魔术 棒 工 具 , 单 击 公鸡 图 片 的 背景 ， 然 
后 按 Delete 键 将 打 散 后 图 片 的 白色 背景 去 掉 。 

(10) 选择 “修改 ”一 “转换 为 元 件 ” 选 项 ， 打 开 “ 转 换 为 元 件 ” 对 话 框 ， 将 处 理 好 的 图 
片 转 换 为 一 个 “图 形 ” 类 型 的 符号 ， 如 图 5.20 所 示 ， 单 击 “ 确 定 ” 按 钮 。 
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生生 mw Hi 

图 5.20 ”把 图 片 转换 为 一 个 “图 形 ee 
(11) 在 图 层 2 的 第 1 wearaeawoniit 部 ， 如 图 5.21 所 示 。 
区 和 5 





5.21 制作 图 层 2 的 第 1 帧 


(12) 在 图 层 2 的 第 50 帧 处 右 击 ， 在 弹出 的 快捷 菜单 中 选择 “插入 关键 帧 ”选项 ， 插 入 一 
个 关键 帧 。 在 50 帧 处 将 小 鸡 移 到 小 屋 处 。 

(13) 在 图 层 2 时 间 轴 面板 中 的 第 1 帧 处 右 击 ， 在 弹出 的 快捷 菜单 中 选择 “动作 ”选项 。 
按 Enter 键 ， 查 看 动画 效果 。 

(14) 选择 “文件 ”一 “保存 ”选项 ， 以 文件 名 animitor3 保存 到 “CA\” 处 。 


5.8 小 结 














动画 技术 自 20 世纪 60 年 代 问世 以 来 ， 已 经 有 了 飞速 的 发 展 。 计 算 机 动画 的 应 用 已 渗透 


lis2 














第 5 章 有 


Re I ea Soborsn rn 


”多 媒体 计算 机 动画 技术 








到 社会 的 许多 方面 。 本 章 首先 介绍 了 动画 的 基本 概念 及 各 种 动画 的 分 类 ， 详 细 地 介绍 了 计算 
机 动画 的 生成 ， 二 维 动画 、 三 维 动画 一 般 的 制作 步骤 等 。 然 后 ， 对 计算 机 动画 的 运动 控制 方 
法 、 动 画 语言 和 动画 的 传输 方式 等 做 了 一 般 性 的 介绍 ， 目 的 是 让 读者 对 计算 机 动画 的 众多 方 
面 能 有 所 了 解 。 本 章 的 最 后 ， 详 细 介绍 了 如 何 创作 Flash 动画 。 希望 读者 通过 学 习 本 章 ， 既 能 
了 解 计算 机 动画 的 一 般 知 识 ， 又 能 学 会 简单 动画 的 创作 方法 。 





























5.9 习 题 


1， 填空 题 


(1) 我 们 所 看 到 的 动画 ,实际 上 是 由 若干 幅 静 止 图 片 所 组 成 的 。 之 所 以 能 有 动 的 感觉 主 
要 是 由 人 类 的 生理 现象 所 致 。 i 
(2) 计算 机 动画 车 按 运动 控制 方式 来 分 ， 有 : > 和 基于 物理 的 动画 
(3) 运动 控制 方法 指 的 是 的 运动 控制 模型 。 N 
(4) 基于 动画 描述 模型 开发 的 动画 语言 主要 有 3 类 ， 它 们 是 线性 表 语 言 、 
Re 
(6) 在 Flash 中 制作 动画 的 方 人 人 再 和 





























2， 选 择 题 FV 
ttm Re De rr 
起 二 、 
A. 关外 与 的 络 家 、 B. 机 与 名 
D. 配 和 





C. 动画 输出 有 
sp 关 一 维 动画 与 三 维 动画 的 叙述 中 不 正 


确 的 是 
二 维 动画 制作 简单 ， 2 
- 维 动画 比 三 维 动画 所 需 存储 空间 小 


维 动画 制作 的 时 间 比 二 维 动画 要 长 
三 维 动画 制作 者 必须 是 计算 机 专业 人 员 
(3) 下 列 不 是 Flash 动画 输出 格式 的 是 __ 
A. .fla B. .gif C. .doc D. .html 
(4) 动画 的 传输 主要 有 两 种 方式 : 其 一 ， 以 符号 方式 表示 和 传输 动画 对 象 及 运动 命令 ; 其 
二 ， 以 位 图 图 像 方式 表示 和 传输 。 下 列 说 法 中 正确 的 是 __。 
A. 前 者 需 传输 的 数据 量 少 ， 后 者 需 传输 的 数据 量 大 
B. 前 者 需 传 输 的 数据 量 大 ， 后 者 需 传输 的 数据 量 小 
C. 前 者 接收 端 重 显 动画 所 需 处 理 的 工作 量 较 大 
D. 前 者 接收 端 显示 的 图 像 质量 不 如 后 者 
(5) 矢量 图 形 和 动画 有 许多 优点 ， 下 列 不 是 其 优点 的 是 _ 
A. 只 用 少量 的 数据 就 可 以 描述 一 个 复杂 的 对 象 
B. 图 形 任意 地 缩放 而 不 会 变形 
C. 显示 图 形 简单 
D. 便于 网 络 传输 
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和 下 多 巡 休 技术 及 其 应 用 (第 版) 

3 判断 题 

(1) 计算 机 动画 是 由 若干 幅 静 止 画面 所 组 成 的 。 

(2) 图 像 显示 的 是 否 流畅 ， 与 动画 本 身 无 关 ， 只 与 显示 器 性 能 有 关 。 
(3) Flash Professional 是 一 种 用 于 制作 三 维 动画 的 软件 。 

(4) Flash 动画 包含 有 补 间 动画 和 逐 帧 动画 两 种 基本 的 动画 制作 方式 。 

















(5) Flash 生成 的 动画 文件 的 默认 扩展 名 为 .fla， 它 可 以 脱离 Flash 环境 独立 运行 。 


4. 简 答题 

(1) 什么 是 动画 ? 什么 是 计算 机 动画 ? 

(2) 用 计算 机 实现 的 动画 最 常见 的 可 分 为 哪儿 类 ? 
G) 什么 是 二 维 动画 ? 二 维 动画 如 何 实现 ? , 
(4) 简 述 制作 计算 机 动画 的 一 般 过 程 。 1 
(5) 什么 是 动画 语言 ? 动画 语言 有 哪儿 种 类 型 ? CN 

(0) 计算 机 动画 的 传输 有 哪儿 种 方式 ? 各 有 何 特点 ? | 

07) 计算 机 动画 和 视频 图 像 有 何 区 别 ? / 站 
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第 6 章 。 多 媒体 信息 的 组 织 与 管理 


教学 提示 


> 


信息 及 数据 的 组 织 和 管理 是 信息 系统 的 核心 问题 之 一 ， 多 媒体 信息 
具有 信息 多 样 、 数 据 量 大 内 容 复 杂 且 难以 描述 等 特点 。 如 何 对 多 
媒体 信息 进行 有 效 的 管理 是 多 媒体 技术 中 的 一 项 重要 内 容 。 多 媒体 
数据 管理 既 可 以 通过 文件 管理 、 超 文本 / 超 媒体 等 方式 进行 ， 也 可 以 
通过 面向 对 象 数据 库 和 多 媒体 数据 库 方 式 进行 。 研 究 并 制定 多 媒体 
信息 基于 内 容 的 表示 方法 是 实现 基于 内 容 的 多 媒体 信息 处 理 的 前 
提 . 基于 内 容 的 多 媒体 数据 表示 是 目前 研究 的 重点 和 难点 ， 虽 然 制 
定 了 多 媒体 信息 描述 的 框架 ， 但 还 没有 实用 的 、 统 一 的 技术 标准 。 





”面向 对 象 数据 库 和 多 媒体 数据 库 从 不 同 的 技术 角度 探索 了 对 多 媒体 


信息 进行 集成 管理 的 方法 ， 但 技术 上 还 有 许多 没有 解决 的 问题 ， 距 
离 完 善 的 实用 阶段 还 有 相当 的 差距 。 


教学 目标 


> 


通过 本 章 的 学 习 , 要求 掌 握 超 文本 和 超 媒体 的 基本 概念 、 主 要 特性 和 
体系 结构 ， 以 及 超 文本 和 超 媒 体 的 组 成 要 素 ， 理 解 超 文本 和 超 媒体 的 
应 用 及 研究 的 问题 ,能 利用 超 文本 标注 语言 对 多 媒体 信息 进行 组 织 与 
管理 ， 了 解 多 媒体 数据 库 及 基本 内 容 检索 的 基本 内 容 及 应 用 ， 


一 国庆 本 撤 天 基 用 (第 2 版 ) 
6.1 多 媒体 数据 与 数据 管理 


随 着 扫描 仪 、 数 码 照相 机 、 数 码 摄像 机 、 数 码 音频 录放 等 多 媒体 采集 设备 的 不 断 普 及 ， 
特别 是 Internet 上 图 片 、 声 音 、 视 频 等 多 媒体 信息 的 大 量 涌现 ， 如 何 对 多 媒体 信息 进行 有 效 的 
组 织 与 管理 是 目前 多 媒体 信息 处 理 中 一 个 十 分 重要 的 问题 。 


6.1.1 多 媒体 数据 的 特点 


多 媒体 信息 与 传统 的 纯 文 本 信息 具有 本 质 的 不 同 ， 它 具有 数据 量 大 、 信 息 多 样 化 、 内 容 
难以 描述 等 特点 。 我 们 所 熟悉 的 多 媒体 数据 包含 了 文本 、 图 形 、 图 像 、 音 频 、 视 频 、 动 画 等 
多 种 不 同 的 媒体 信息 。 在 这 些 信 息 中 ， 有 些 信息 的 编码 方式 是 固定 的 ， 如 文本 ， 它 的 基本 特 

点 是 不 同 信息 符号 的 编码 事先 已 经 定义 ， 如 针对 英文 及 符号 的 ASCF 编 码 集 ， 针 对 简体 汉字 
的 GB 2312 字符 编码 集 等 。 不 同 的 文字 在 组 成 一 段 文本 信息 RS 部 的 编码 已 经 确定 ， 被 
称 为 是 格式 化 的 信息 。 对 于 格式 化 的 信息 ， a SO 



































些 信息 的 检索 可 由 计算 机 按照 统一 的 检索 算法 进行 处 更 攀 少 需要 用 户 考虑 信息 的 内 部 组 织 
方式 及 展示 方式 。 

相对 于 文本 这 种 最 常见 的 、 最 简单 的 信息 多 媒体 中 包含 的 其 他 类 型 的 数据 都 是 非 格式 
化 的 数据 ， 且 具有 以 下 的 特点 。 A 

(D 多 媒体 数据 种 类 多 、 Ce oi 尤其 是 音 、 视 频 
数据 。 

多 拓 要 所 大 经 注 站, 娄 从 过 各 人 用 了 有 页 
te ee eee en 多 媒体 压缩 编码 算法 种 类 繁多 ， 并 
处 于 快速 发 展 过 程 中 不 同时 期 的 压缩 算法 可 能 存在 版 本 控制 问题 。 

ee ee 现行 的 多 合体 数 据 压 帝 编码 方案 般 只 考虑 消除 信息 
中 存在 的 宛 余 记 /而 不 考虑 这 些 信息 向 人 们 所 传达 的 内 容 及 代表 的 真实 意义 ， 如 一 段 视频 中 
常 包含 多 个 视频 片段 。 而 基于 内 容 的 、 统 一 的 多 媒体 信息 描述 方法 是 一 个 研究 前 沿 的 问题 
许多 问题 尚未 完全 解决 ， 所 以 对 多 媒体 信息 进行 有 效 组 织 和 检索 比较 困难 ， 如 图 形 、 图 像 和 
视频 节目 中 基于 内 容 的 检索 等 。 

(4) 多 媒体 数据 包含 的 信息 具有 复合 性 和 时 序 性 ， 重 现 过 程 可 能 会 有 服务 质量 (QoS) 的 要 
求 。 例 如 ， 视 频数 据 中 一 般 都 包含 有 音频 信息 ， 有 些 视频 中 甚至 还 包含 有 字幕 等 信息 ， 在 播 
放 时 对 时 延 要 求 较 高 ， 而 且 需 要 字幕 、 音 频 、 视 频 的 同步 。 

多 媒体 数据 的 以 上 特点 使 得 这 些 数据 的 管理 面临 着 十 分 复杂 的 技术 要 求 。 如 何 高 效 地 
对 多 媒体 数据 进行 管理 ， 以 及 如 何 实现 基于 内 容 的 管理 ， 是 多 媒体 数据 库 技术 研究 的 核心 
问题 之 一 。 


6.1.2 多 媒体 数据 的 管理 技术 


随 着 多 媒体 技术 的 发 展 ， 数 码 照 相机 、 数 码 摄像 机 、 计 算 机 动画 、CD 音乐 、MP3 音乐 
等 各 种 各 样 的 多 媒体 产品 和 信息 也 越 来 越 多 ， 每 天 新 产生 的 多 媒体 信息 量 急 剧 增加 。 与 此 同 
时 ， 如 何 对 越 来 越 多 的 多 媒体 数据 进行 有 效 管 理 是 摆 在 人 们 面前 的 紧迫 任务 。 

多 媒体 数据 的 管理 就 是 对 多 媒体 资料 进行 存储 、 编 辑 、 检 索 和 展示 等 。 随 着 多 媒体 数据 
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| 
的 管理 方式 和 技术 的 不 断 发 展 ， 目 前 对 计算 机 多 媒体 信息 的 管理 主要 有 文件 系统 管理 方式 、 
扩充 关系 数据 库 方式 、 面 向 对 象 的 数据 库 方式 和 超 文本 ( 超 媒体 ) 管 理 方式 等 。 


1. 文件 系统 管理 方式 


文件 系统 管理 方式 是 计算 机 对 软 、 硬 件 资源 统一 管理 的 传统 方式 。 从 外 部 存储 器 出 现 以 
后 ， 计 算 机 对 信息 的 管理 方式 主要 是 使 用 文件 系统 管理 方式 。 与 其 他 进入 计算 机 的 信息 一 样 ， 
多 媒体 数据 必须 以 二 进 制 文件 的 形式 存储 在 计算 机 上 ， 所 以 可 以 用 各 种 操作 系统 的 文件 管理 
功能 实现 对 多 媒体 数据 的 存储 管理 。 

根据 不 同 媒体 信息 产生 方式 的 不 同 ， 多 媒体 数据 的 文件 格式 很 多 ， 常 见 的 多 媒体 数据 文 
件 格式 有 以 下 几 种 。 

(1) 文本 文件 ，TXT、WRI、DOC、PPT、RTF 等 。 

(2) 音频 文件 : VOC、WAV、DAT(CD)、MID、MP3、WMA、 AIFF、AU 等 。 

(3) 视频 文件 : AVI、DAT(MPEG)、ASF、WMV、 RM、 RM Mov. FLC、FLI、FLX、 
MP4 等 。 SAN 

(4) 矢量 图 形 文件 : DRW、PIC、WMF、WPG、 6M、 CLP、DXF、HGL 等 。 

(5) 图 像 文件 : PCX、BMP、TIF、 JPGUPEG)® GI IMG、 DIB、 PNG、ICO、PSD、 
EPS、MAC、TGA 等 。 XA 

(6) 数据 库 文 件 ，DBF 等 。 

在 目前 流行 9 Windows 操作 系统 中 利用 资源 管理 器 不 仅 能 实现 文件 查询 、 删除 、 复 制 
等 存储 名 管理 功能 ， 而 且 可 以 通过 六 休 必 性 的 关联 当 用 户 双 击 鼠标 时 就 能 实现 有 些 图 文 资料 
编辑 、 显 示 或 播放 等 。 同 时 > 为 便于 用 户 管理 和 浏览 多 数据 ， 近 年 来 出 现 了 很 多 图 形 、 
图 像 的 浏览 软件 ， 如 广泛 这 行 的 图 像 浏览 编辑 软件 其 CDSee 等 。 这 些 工具 软件 不 仅 可 浏览 绝 
大 部 分 格式 的 图 形 图 像 文 件 ( 如 BMP、GIF、 JPEG、 ECX、Photo-CD、PNG、TGA、TIFF、 
WMEF 等 )， 而 且 提供 子 常用 的 图 形 图 像 编辑 二 能 如 调整 图 像 、 选 取 图 像 、 复 制图 像 、 转 换 
图 像 的 格式 等 功能 。 六 
操作 系统 以 树 型 目录 的 层次 结构 实现 对 文件 的 分 类 管理 。 它 具有 层次 分 明 、 结 构 性 好 等 
优点 ,尤其 是 随 着 软件 技术 的 发 展 ， 在 Windows 2000 以 上 版 本 的 操作 系统 中 ,提供 了 对 主流 
格式 (并 非 所 有 格式 ) 多 媒体 文件 的 “ 缩 略 图 ”和 预览 方式 ,用户 可 在 选取 而 不 是 打开 这 些 文件 
的 时 候 ， 预 览 音 频 、 视 频 、 图 形 和 图 像 文 件 。 利 用 文件 系统 管理 方式 的 关键 是 建立 合理 的 目 
录 结 构 以 便于 多 媒体 数据 文件 的 管理 。 
尽管 文件 系统 的 管理 方式 对 文件 的 存储 管理 比较 简单 ， 但 当 多 媒体 数据 文件 的 数量 和 种 
类 过 多 时 ， 浏 览 和 查询 的 速度 将 大 大 降低 ， 而 且 由 于 可 以 预览 的 文件 格式 受 限 制 ， 某 些 格式 
的 多 媒体 文件 将 不 能 通过 “预览 ”实现 展示 与 播放 。 所 以 ， 文 件 系统 的 管理 方式 一 般 仅 适 
于 小 的 项 目 管理 或 较 特殊 的 数据 对 象 ， 所 表示 的 对 象 及 相互 之 间 的 逻辑 关系 比较 简单 ， 如 管 
理 单一 媒体 信息 (如 图 片 、 动 画 等 )。 

2. 扩充 关系 数据 库 的 方式 

数据 库 技术 可 以 实现 将 多 种 不 同属 性 的 数据 置 于 同一 个 数据 库 文件 中 进行 统一 的 管理 ， 
具有 文件 系统 管理 方式 不 可 比拟 的 优越 性 ， 但 传统 的 关系 型 数据 库 只 能 处 理 数字 、 文 字 、 日 
期 、 逻 辑 数 据 等 传统 的 文本 数据 ， 不 能 对 音频 、 视 频 和 图 形 图 像 数 据 进行 统一 管理 。 那 么 如 
何 利用 现 有 的 数据 库 系统 、 通 过 改进 技术 实现 对 多 媒体 数据 的 统一 管理 呢 ? 可 以 设想 ， 如 果 
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一 多 苦 你 找 林 及 应 用 (第 二 服 ) 








-在原 有 的 关系 数据 库 基础 上 增加 对 多 媒体 的 有 关 数据 类 型 的 持 ， 原 有 的 数据 库 系 统 就 可 以 


实现 对 相应 多 媒体 类 型 数据 的 存储 和 统一 管理 。 

但 设想 与 实现 之 间 往 往 存在 着 一 定 的 差距 。 关 系数 据 库 系 统 是 在 严格 的 关系 模型 基础 上 
建立 起 来 的 ， 它 描述 的 是 各 属性 之 间 及 各 元 组 间 的 内 在 的 、 本 质 的 关系 。 但 多 媒体 数据 所 表 
达 的 内 在 含义 目前 还 没有 一 个 标准 的 、 通 用 的 描述 方法 ， 利 用 关系 数据 库 的 管理 方式 ， 简 单 
的 逻辑 关系 无 法 表达 复杂 的 多 媒体 信息 。 可 以 说 多 媒体 数据 的 丰富 内 含 已 远 远 超出 了 关系 模 
型 的 表示 能 力 。 所 以 在 多 媒体 信息 描述 技术 方面 如 果 没 有 大 的 突破 ， 利 用 关系 数据 库 技术 来 
对 多 媒体 信息 进行 妥善 的 处 理 就 存在 着 很 多 困难 。 在 现 阶 段 比较 可 行 的 方案 是 对 原 有 系统 进 
行 一 些 扩 充 ， 使 其 支持 声音 、 图 像 等 相对 简单 的 多 媒体 数据 。 目 前 全 球 大 型 的 数据 库 公 司 都 
已 将 原 有 的 关系 数据 库 产 品 中 引入 新 的 数据 类 型 ， 以 便 存 储 多 媒体 对 象 字段 ， 如 图 像 、 声 音 
等 ， 使 之 在 一 定 程度 上 能 支持 多 媒体 的 应 用 ， 如 Oracle、DB2、SYBASE、VFP、INFORMIX 
等 。 使 用 关系 数据 库 对 多 媒体 数据 进行 存储 和 管理 的 方法 如 下 。 

(1) 用 专用 字段 存放 全 部 多 媒体 文件 ， a 集中 存放 与 管理 。 

(2) 将 多 媒体 数据 分 段 存放 在 不 同 字段 中 SR 






































(3) 将 文件 系统 与 数据 库 系统 管理 方式 结合 起 来 , 效 媒 体 资料 以 文件 系统 方式 存放 ,用 关 
系数 据 库存 放 媒体 类 型 、 应 用 程序 名 、 下 以 便 用 数据 库 方式 对 多 媒体 数 
据 进行 查询 。 A 

3， 面 向 对 象 数据 库 的 方式 NK 

20 世纪 80 年 代 后 期 ， 出 现 了 和 池 妆 的 玫 据 库 管理 统 。 面 向 对 象 数据 库 是 指 对 象 的 
集合 、 对 象 的 行为 、 状 态 和 联系 是 以 pet 义 的 。 面 向 对 象 的 数据 库 技术 

其 入 








将 面向 对 象 的 程序 设计 语言 和 数据 库 技术 相 结合 ， 媒体 数据 库 研究 的 主要 方向 。 面 向 对 
象 技 术 为 新 一 代数 据 库 应 所 需 的 数据 模型 提供 了 3 通过 类 、 对 象 、 封 装 、 继 承 和 多 
杰 的 概念 和 方法 来 插 淮 敌 杂 的 对 象 ， 可 以 玉 下 电 : 示 各 种 对 象 及 其 内 部 结构 和 联系 。 
面向 对 象 库 方式 的 优点 如 下 。 

(1) 多 媒体 的 复杂 内 全 可 以 折 旬 为 被 类 型 法 在 一 起 的 节点 网 络 , 它 可 以 用 各 对 
象 方法 所 描述 ， 面 向 对 象 数据 库 的 复杂 对 象 管理 能 力 正好 对 处 理 非 格 式 多 媒体 数据 适用 。 
(2) 面向 对 象 数据 库 可 根据 对 象 标 识 符 的 导航 功能 , 实现 对 多 媒体 数据 的 存 取 , 有 利于 对 
相关 信息 的 快速 存 取 。 

(3) 面向 对 象 的 编程 方法 为 高 效能 软件 开发 提供 了 技术 支持 。 

尽管 面向 对 象 的 数据 库 方式 具有 很 多 优点 ， 但 由 于 面向 对 象 概 念 在 应 用 领域 中 尚未 有 统 
一 的 标准 ， 使 得 面向 对 象 数据 库 直接 管理 多 媒体 数据 尚未 达到 实用 水 平 。 

4. 超 文 本 或 超 媒 体 的 方式 

超 文本 技术 是 一 种 对 文本 的 非 线性 阅读 技术 。 它 将 文本 信息 以 节点 表示 ， 并 将 各 个 节点 
以 其 内 在 的 联系 ( 称 为 链 ) 进 行 连接 ,从 而 构成 一 个 非 线 性 网 状 结构 。 这 种 非 线 性 网 状 结构 可 忆 
按照 人 脑 的 联想 思维 方式 把 相关 信息 联系 起 来 ， 供 读者 浏览 。 在 超 文本 系统 中 引入 了 多 媒体 
后 ， 即 节点 的 内 容 可 以 是 多 媒体 元 素 时 ， 起 文 本 就 成 了 超 媒体 。 超 媒体 方式 以 超 文本 的 思想 
来 实现 对 多 媒体 数据 的 存储 、 管 理 和 检索 。 超 媒体 系统 中 的 一 个 节点 可 以 是 文本 、 图 形 、 图 
像 、 音 频 、 视 频 、 动 画 ， 也 可 以 是 一 段 程序 ， 其 大 小 可 以 不 受 限 制 ， 通 过 链 的 指示 提供 了 各 
节点 之 间 信息 的 浏览 与 查询 功能 。 目 前 Internet 上 的 Web 页 基本 上 都 是 按照 超 媒体 的 思想 来 
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| 
实现 对 多 媒体 信息 的 组 织 。 

超 文本 或 超 媒体 应 用 系统 可 以 使 用 高 级 语言 进行 编程 开发 ， 也 可 以 用 支持 超 文本 功能 的 
工具 软件 来 实现 。 目 前 可 用 于 实现 超 文本 或 超 媒体 的 软件 很 多 ， 如 HTML( 超 文本 标记 语言 )、 
Microsoft Office 组 件 中 的 链接 与 嵌入 对 象 技术 等 都 可 以 实现 超 媒体 的 功能 。 超 文本 或 超 媒体 
技术 的 特点 决定 了 它 适 合 面向 浏览 的 应 用 ， 所 以 特别 适用 于 Web 页 、 多 媒体 课件 、 电 子 出 版 
物 等 ， 但 不 适用 于 大 量 多 媒体 数据 管理 。 

综合 的 多 媒体 数据 管理 模式 

多 媒体 数据 管理 的 不 同方 法 各 有 优 缺 点 ， 它 们 分 别 适 应 于 不 同 的 应 用 。 如 果 将 不 同 的 方 
法 进行 有 效 的 组 合 ， 充 分 发 挥 每 一 种 方法 的 优势 ， 将 会 提高 对 多 媒体 数据 管理 的 效率 。 目 前 
在 综合 的 多 媒体 数据 模式 下 ， 常 用 的 方法 有 两 种 。 

(1) 文件 系统 管理 与 关系 数据 库 管 理 相 结合 。 实 现 的 主要 方法 是 将 多 媒体 资料 以 文件 系 
统 的 方式 存储 在 计算 机 中 ， 的 二 必 有 全 二 全 这 让 型 、 应 用 程序 名 、 媒 
体 属性 和 关键 词 等 ， 从 而 实现 了 多 媒体 数据 存储 与 查询 、 这 种 方式 实现 起 来 比较 
简单 ， 所 以 在 目前 多 媒体 资料 管理 系统 中 用 的 较 多 。 :wi 

(2) 用 面向 对 象 的 概念 扩充 关系 数据 库 。 传 统 关 系 型 数据 库 系统 中 不 支持 多 媒体 数据 类 
型 及 相应 的 操作 ， Re 基本 关系 类 型 进行 扩充 ， 使 其 支持 复杂 
对 象 及 相关 操作 ， 就 可 以 利用 AS 现 对 多 媒体 数据 的 管理 。 


02 5 类 


wetting YR “利用 超 文 本 与 超 媒体 技术 可 以 对 多 
















































































媒体 数据 进行 有 效 的 组 织 并 构建 出 广泛 应 用 网 的 多 媒体 应 用 系统 。 本 节 主 要 介绍 超 
SS 主要 成 分 、 应 用 与 发 展 等 相关 内 容 。 
6.2.1 ” 超 文 本 与 超 召 体 的 概念 


一 个 超 文本 和 超 媒 体系 统 可 以 看 成 由 节点 (Node) 和 链 (Link) 构 成 的 信息 关系 网 络 。 超 文本 
是 相对 于 文本 而 言 的 一 种 信息 组 织 方式 。 文 本 是 人 们 熟知 的 以 文字 和 字符 表示 信息 的 一 种 方 
法 。 其 特点 是 在 阅读 和 学 习 时 ， 通 常 是 逐 字 、 逐 行 、 逐 页 按 顺序 阅读 ， 文 本 信息 的 文件 组 织 
方式 采用 线性 和 顺序 的 结构 形式 。 文 本 方式 对 文本 信息 的 组 织 是 可 行 的 ， 因 为 文本 本 身 就 是 
文字 、 符 号 等 组 成 的 格式 化 数据 ， 而 对 图 形 、 图 像 、 音 频 等 非 格式 化 的 多 媒体 数据 来 说 ， 
纯 文 本 方式 难以 适应 对 多 媒体 数据 管理 的 要 求 。 
1.， 超 文本 的 发 展 历史 


1945 年 ， 科 学 家 Vannevar Bush(1890 一 1974) 在 其 论文 中 提出 了 信息 超载 问题 ， 预 言 了 文 
本 存在 一 种 非 线性 结构 ， 提 出 了 采用 交叉 索引 链接 来 解决 这 个 问题 。 并 在 他 设计 的 一 种 名 为 
“Memex” 的 系统 中 首先 描述 了 这 一 概念 ， 利 用 这 一 系统 实现 了 对 微缩 胶片 的 管理 和 检索 。 
虽然 他 没有 明确 使 用 “ 超 文本 ”一 词 ， 但 目前 公认 为 他 是 超 文本 技术 的 创始 人 。 

1965 年 ，Ted Nelson 创造 了 “ 超 文 本 (Hypertexb” 一 词 ， 命 名 这 种 非 线性 网 状 文本 为 超 
文本 ， 而 且 在 计算 机 上 实现 这 个 想法 ， 并 在 “Xanadu” 计 划 中 ， 尝 试 使 用 超 文本 方法 把 分 布 
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”在 不 同 地 域 计算 机 上 的 文献 资源 进行 联机 





超 文 本 从 1945 年 的 初步 设想 , 到 20 世纪 60 年 代 正式 产生 , 20 世纪 70 年 代 有 较 大 发 展 ， 




















20 世纪 80 年 代 开始 用 于 实际 并 得 到 快速 发 展 。1987 年 11 月 , 在 美国 北 卡罗来纳 大 学 召开 了 
ACM 超 文本 会 议 ，1989 年 在 英国 约克 郡 举行 了 第 一 次 公开 的 超 文 本 会 议 ，1990 年 在 法 国 举 
行 了 第 一 届 欧 洲 超 文本 会 议 ; 1989 年 , 第 一 本 专门 的 超 文本 科学 杂志 Hypermedia 正式 出 版 发 











行 。 所 有 这 些 学 术 活动 及 其 相关 研究 ， 都 对 超 文 本 技术 的 发 展 起 到 了 重要 的 推动 作用 。 


2. 超 文 本 的 相关 概念 
(1) 超 文本 : 由 节点 和 表示 节点 之 间 关 系 的 链 组 成 的 非 线性 网 状 结构 。 


(2) 节点 : 按 文 本 信息 内 部 固有 独立 性 和 相关 性 划分 成 的 不 同 的 基本 信息 块 。 具体 到 应 用 

































































中 ， 每 一 个 节点 可 以 是 某 一 大 小 的 文本 块 ， 如 卷 、 文 件 、 帧 或 更 小 的 信息 单位 。 
(3) 链 : 用 来 表示 节点 之 间 的 逻辑 关系 ， 并 用 来 连接 各 节点 。 通 常情 况 下 ， 链 的 个 数 是 不 














固定 的 ， 它 依赖 于 














与 目标 节点 相连 。 


文本 与 超 文本 的 结构 如 








py XX 


\ 


每 个 节点 的 内 容 。 有 些 节点 与 许多 节点 相连 * 而 有 的 节点 可 能 只 有 一 个 链 


图 6.1 所 示 。 , 二- 
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Se 
图 6.1 文本 结构 与 超 文本 结构 


DA 人 
() 超 媒 体 :指引 六 效 媒 体 信息 的 超 交 本 系统 ， 即 超 媒 体 一 超 文本 十 多 媒体 。 
3， 超 文本 的 主要 成 分 
超 文本 主要 是 由 节点 和 表示 节点 之 间 关系 的 链 构 成 的 信息 网 络 。 其 主要 成 分 是 节点 和 链 。 














在 实际 应 用 中 ， 节 点 























除了 可 以 表示 具体 的 某 种 实际 信息 外 ， 还 可 用 于 存储 节点 的 组 织 方式 和 





推理 类 型 。 节 点 按 其 表示 信息 的 成 分 不 同 可 划分 为 以 下 几 种 。 


1) 节点 




















(1) 文本 节点 : 





于 表示 媒体 信息 的 节点 有 如 下 。 
文本 或 片段 组 成 。 





(2) 图 形 节点 : 


由 矢量 图 


或 其 一 部 分 组 成 。 

















(3) 图 像 节点 : 
(4) 声音 节点 : 








一 段 录制 





(5) 视频 节点 ; 
(6) 混合 媒体 节 








由 扫描 仪 或 摄像 机 等 输入 的 静态 图 像 及 其 性 质 构 成 。 


或 合成 的 声音 。 


视频 信息 组 成 。 
点 : 上 述 5 种 节点 的 某 种 组 合 。 


(7) 按钮 节点 : 用 于 执行 某 一 过 程 ， 并 获取 其 执行 的 结果 。 














于 表示 组 织 和 











(1) 索引 节点 : 


上 
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推理 类 型 的 节点 如 下 。 
单个 索引 项 组 成 ， 用 以 表示 某 种 索引 的 方法 。 





| — WW 

(2) 索引 文本 节点 : 由 指向 索引 节点 的 链 组 成 。 

(3) 对 象 节点 : 用 来 描述 对 象 ， 用 以 表示 知识 的 某 种 结构 。 

(4) 规则 节点 : 用 于 存放 规则 ， 指 明 符 合 规则 的 对 象 、 判 断 规则 是 否 被 引用 及 规则 的 解释 
说 明 等 。 

2) 链 

链 可 用 来 表达 不 同 节点 之 间 的 关系 而 用 于 导航 与 检索 ， 也 可 用 于 处 理 超 媒体 节点 和 链 之 
间 的 组 织 关 系 和 推理 规则 。 根 据 链 的 用 途 ， 可 将 链 细 分 为 以 下 10 种 。 

(1) 基本 链 : 表示 节点 的 基本 顺序 。 

(2) 移动 链 : 表示 从 一 个 节点 到 另 一 个 相关 节点 ， 即 导航 。 

(3) 缩放 链 : 扩大 /缩小 当前 节点 的 显示 。 

(4) 全 景 链 : 返回 超 文本 系统 的 高 层 。 

(5) 视图 链 ， 隐藏 性 的 ， 常 被 用 来 实现 可 靠 性 和 安全 性 。 ， 了 伦 






















































































(6) 索引 链 : 用 于 实现 节点 中 的 “点 ”和 “ 域 ”之 间 的 i 

(7) Is-a 链 : 用 来 组 织 节点 。 < 

(8) Has-a 链 : 描述 节点 的 性 质 。 a 

(9) 懂 涵 链 ， 等 价 于 规则 。 NN] 

(10) 执行 链 ， 即 按钮 ， 触 发 执行 链 引 起 执行 一 段 代码 。 

前 种 用 于 导航 和 检索 信息 ， 后 5 和 用 下 超 媒 人 节点 和 链 的 组 织 和 推 旭 。 

3) 热 标 Po x 

热 标 (Hotspot) 是 确定 信息 关联 注 ， 由 将 引起 闪闪 容 的 轩 区 。 很 旺 然 ， 不 同 的 
媒体 应 有 不 同形 式 的 热 标 。 根 据 媒体 种 类 的 不 同 ， 攻 标的 形式 一 般 有 以 下 几 种 。 

CD 热 字 。 热 字 (Hetrwoia 惠 文本 中 被 指定 具有 特殊 信义 或 进一步 解释 的 字 、 词 或 词组 。 
通常 ， 斜 体 加 底线 的 词 都 是 热 字 ， 触 发 这 些 词 将 从 按照 设计 者 的 安排 出 现 相应 的 进一步 的 解 
释 ， 或 出 现 更 形象 的 演示 ， 或 转移 到 另外 相关 内 容 显示 。 

(2) 热 区 。 热 区 (Hot-area) 是 在 所 显示 的 图 像 或 类 似 于 图 像 的 显示 区 上 指明 的 一 个 敏感 区 
域 ， 作 为 触发 转移 的 源 点 。 在 一 幅 图 像 上 的 不 同 区 域 可 以 有 不 同 的 信息 表现 。 例 如 ， 一 幅 人 
体 图 像 中 的 不 同 区 域 可 以 设置 成 不 同 的 热 区 ， 当 触发 这 些 热 区 时 ， 系 统 就 会 按 设 定好 的 方法 
进行 表现 ， 介 绍 该 人 体 部 位 的 详细 情况 和 细节 。 热 区 的 设 定 不 同 于 热 字 ， 由 于 图 像 十 分 直观 
但 不 便于 用 语言 或 文字 描述 ， 所 以 一 般 都 采用 所 见 即 所 得 的 方式 在 图 中 直接 指定 热 区 。 

(3) 热 元 。 在 图 形 媒 体 中 ， 图 元 是 最 基本 的 单位 ， 如 一 个 图 、 一 条 线 、 一 串 文 字 等 。 为 了 
使 这 些 相对 独立 的 图 形 单位 能 够 作为 信息 转移 的 链 源 , 就 引入 了 热 元 (Hot-element) 的 概念 。 这 
种 方式 非常 适合 在 不 影响 图 形 本 身 变换 (如 移 位 、 放 大 或 缩小 ) 的 同时 , 又 可 以 由 该 图 元 引发 相 
应 的 进一步 关联 信息 的 表现 。 
(4) 热点 。 热 点 (Hot-Point) 主 要 用 于 时 基 类 媒体 (如 视频 、 声 音 等 ) 在 时 间 轴 上 的 触发 转移 。 
例如 ， 在 应 用 中 常常 出 现 如 下 情况 ， 用 一 般 视频 在 介绍 某 个 重大 历史 事件 的 过 程 中 ， 往 往 突 
然 会 对 其 中 某 个 片段 更 感 兴趣 ， 从 而 希望 了 解 更 多 的 内 容 。 这 就 要 求 能 从 这 段 视频 的 相应 时 
间 轴 处 转移 到 另外 有 关 解释 的 其 他 内 容 处 ， 这 个 起 点 处 就 称 为 热点 。 在 这 一 点 上 它 与 文本 媒 
体 十 分 相似 ， 帧 序列 可 以 像 文本 段 一 样 在 序列 内 、 文 献 内 或 文献 间 进行 转移 。 视 频 对 象 可 以 
采用 长 序列 ， 要 由 起 始 帧 和 结尾 帧 确定 所 选 定 的 视频 段 ， 从 而 可 以 从 一 个 视频 段 直 接 跳 往 另 
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一 外 一 个 视频 段 ， 也 就 可 以 实现 自我 解释 。 其 他 时 基 类 媒体 也 基本 相同 。 

















(5) 热 属性 。 热 属性 是 把 关系 数据 库 中 的 属性 作为 热源 来 使 
可 以 根据 操作 产生 许多 不 同 的 结果 ， 如 不 同 的 排序 顺序 、 选 择 不 


数据 媒体 是 一 种 特定 的 格式 化 符号 数据 , 所 以 大 多 数 情况 下 可 以 采 上 
6.2.2” 超 文本 与 超 媒体 系统 的 组 成 


超 文本 与 超 媒体 系统 的 组 成 主要 有 以 下 两 种 系统 模型 。 
1) HAM 模型 
HAM 模型 是 Campbell 和 Goodman 于 1988 年 提出 的 超 文本 和 








昌 于 
































关系 框架 下 的 各 元 组 


同 元 组 子 集 等 , 但 总 的 来 说 ， 
类 似 了 





F 热 字 的 热 标 方法 。 


象 机 (Hypertext Abstract 




















a 





接口 层 、 超 文本 抽象 








导 
云 。 


Machine，HAM) 模 型 。HAM 模型 把 超 文本 系统 划分 为 3 个 层次 : 
机 层 、 数 据 库 
2) Dexter 模型 
Dexter 模型 是 由 Dexter 小 组 提出 的 一 种 超 文本 与 超 媒体 站 给 
本 系统 划分 为 3 个 层次 ,运行 层 、 存 储 层 和 元 素 内 部 层 。, 除了 术语 不 同 
A :模型 的 层次 名 结构 





之 间 的 接口 之 外 ， 两 个 模型 基本 相似 。 图 6.2 给 


用 户 接 凯 层 


SA 
了 MM 模型 





X Diextef 模型 
| 图 62 超 文本 与 起 文本 系统 结 模型 


本 和 多 媒体 信息 汐 组 织 方式 对 浏览 或 学 习 者 来 
有 很 好 的 灵活 性 。 超 文本 与 超 媒体 在 互联 网 和 多 媒 
、 成 功 的 应 导 正 是 其 强大 生命 力 的 体现 。 

从 目前 技术 发 展 和 应 用 层面 来 看 ， 超 文本 与 超 媒体 技术 主要 向 
(1) 从 超 文本 到 超 媒体 。 从 超 媒体 所 包含 的 信息 形式 上 看 , 超 媒体 信息 


> 
超 文本 与 超 媒 体 笠 广 


览 和 学 习 的 








以 下 两 个 方面 发 


模型 ， 该 模型 把 超 文 
并 且 更 加 明确 了 层次 
为 图 。 


说 就 显得 十 分 自然， 
体 集成 系统 中 的 广泛 





展 。 
息 更 加 接近 自然 表达 





的 


形式 ， 更易 为 人 们 所 接受 。 超 媒体 信息 几乎 覆盖 了 信息 世界 的 各 个 方面 ， 


所 以 超 文本 向 超 











媒体 发 展 是 超 文 本 发 展 的 主要 方向 之 一 。 

(2) 超 媒体 与 人 工 智 能 、 专 家 系统 的 结合 。 
超 媒体 与 知识 系统 有 十 分 相似 之 处 ， 而 且 它 存 在 良好 的 互补 性 。 在 超 媒 
知识 规则 ， 使 超 媒体 的 网 络 包 含 计算 和 逻辑 推理 能 力 ， 并 使 多 媒体 信息 
使 超 文本 的 应 用 发 生 质 的 变化 ， 使 它 绪 盖 更 广泛 的 领域 ， 在 信息 化 社会 


6.3” 超 文本 标记 语言 


























超 文 本 标记 语言 (HTML) 是 按照 超 文本 与 超 媒体 思想 设计 的 、 应 用 于 
记 语 言 ， 是 目前 网 络 信息 传递 中 使 用 最 为 广泛 的 标记 语言 。 学 习 和 掌握 
于 我 们 深入 理解 多 媒体 数据 面向 浏览 的 组 织 方式 。 





fe2 


不 论 从 信息 的 表达 形式 还 是 从 数据 模型 形式 ， 


体 的 链 和 节点 中 嵌入 
的 表示 智能 化 ， 这 会 
bh 发 挥 更 重要 的 作 


























互联 网 信息 传播 的 标 
超 文 本 标记 语言 有 助 





| 
6.3.1 HTML 简介 


HTML(Hyper Text Markup Language) 是 超 文 本 标记 语言 的 简称 。HTML 是 在 1986 年 ISO 
公布 的 信息 管理 国际 标准 SGML(Standard Generalized Markup Language， 标 准 通用 标记 语言 ) 
基础 上 发 展 起 来 的 ， 它 定义 了 独立 于 平台 和 应 用 的 文本 文档 的 格式 、 索 引 和 链接 信息 ， 为 用 
户 提供 一 种 类 似 于 语法 的 机 制 ， 用 来 定义 文档 的 结构 和 指示 文档 结构 的 标签 。HTML 对 不 同 
的 媒体 信息 使 用 标记 (tag) 来 控制 达到 预期 的 显示 效果 。HTML 的 标记 按 用 途 可 以 分 为 以 下 不 
同 的 类 型 。 

(1) 基本 标记 : 用 于 创建 一 个 HTML 文档 、 设 置 文档 的 标题 以 文档 的 可 见 部 分 

(2) 标题 标记 : 设置 文档 在 标题 栏 中 的 标题 。 

(3) 文档 整体 属性 标记 : 设置 文档 的 背景 、 文 字 颜 色 、 各 类 超 链 接 的 颜色 。 

(4) 文本 标记 : 设置 文本 的 字体 、 字 号 和 文字 颜色 等 属性 。 - 险 

(5) 链接 标记 : 创建 内 部 或 外 部 的 超 链接 。 SN <\ 

(6) 格式 排版 标记 ， 设 置 文档 段落 的 格式 。 \ 

(7) 图 形 元 素 标记 : 在 文中 让 加 图 人 设伏 边框 、 显 示 的 图 像 大 小 等 。 

(8) 表格 标记 : 创建 表格 并 设置 表 头 的 格式 。、 AAA- 

(9) 表格 属性 标记 ， 设置 表格 的 大 小 、 对 间 男 江 、 边框 等 表格 属性 。 

(10) 窗 框 标记 : 定义 窗 框 的 大 小 及 在 不 支持 窗 框 的 浏览 器 中 显 EE 示 的 提示 。 

(11) 窗 框 属性 标记 : 设置 窗 [ 1 杠 的 内 容 、 边框 、 滚动 条 及 是 否 允许 用 户 调整 窗口 。 

(12) 表单 标记 ， 用 于 创建 表单 滚动 菜单 、 下 拉 菜 单 ”、 .文本 框 、 单 / 复 选 框 、 按 钮 等 

HTML 继承 了 SGML 的 全 部 优点 实现 了 对 现 有 从 种 文档 的 结 构 类 型 的 支持 ， 并 可 用 于 创 
建 与 特定 的 软件 与 硬件 无 闫 的 文档 ， 活 地 使 用 TMD 的 各 种 标记 ， 可 将 各 种 媒体 信息 组 织 成 
为 画面 生动 活泼 、 大 们 喜闻乐见 的 网 页 形式 立 所 以 被 广泛 地 应 用 于 Intemet 的 信息 传递 过 程 中 。 
HTML 采用 超 文本 方 式 来 组 织 多 媒体 信息 ”从 而 构成 一 个 超 媒体 系统 。 它 规定 了 以 标记 
方式 设 定 各 种 多 媒体 信 息 的 展示 (显示 ) 属 性 , 用 HTML 组 织 的 文件 本 身 属 于 普通 的 文本 文件 ， 
它 可 以 用 一 般 的 文字 编辑 软件 编辑 ， 如 记事 本 、Microsoft Word 等 。 也 可 以 使 用 专门 的 HTML 
文件 编辑 软件 来 编辑 ， 如 Microsoft FrontPage、Sausage Software 公司 的 HotDog HTML 编辑 
器 等 。HTML 文件 的 扩展 名 可 以 是 .html 或 .htm， 现 有 的 Internet 浏览 器 都 支持 这 两 种 类 型 的 
HTML 文件 。 浏 览 器 用 于 将 HTML 文件 中 包含 的 信息 以 标记 所 指示 的 显示 方式 展现 给 用 户 ， 
目前 互联 网 上 的 大 多 数 网 页 都 是 以 HTML 方式 对 多 媒体 信息 进行 组 织 的 。 


6.3.2 ”HTML 语法 结构 




































































































































































1. HTML 文件 的 基本 结构 


HTML 文件 是 标准 的 ASCII 文件 ， 个 文本 编辑 器 打开 一 个 HTML 文件 , 可 以 看 到 其 
内 容 是 加 入 了 许多 被 称 为 标记 (Tag) 的 特殊 字符 串 的 普遍 文本 文件 。 一 个 HTML 文件 应 具有 
以 下 基本 结构 。 




















<html> <!--html 文件 开始 标记 --> 
<head> <!-- 文 件 头 开 始 标记 --> 

用 化 天 

</head> <!-- 文 件 头 结束 标记 --> 
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<body> <!-- 文 件 体 开始 标记 --> 
文件 体 
</body> <!-- 文 件 体 结束 标记 --> 
</html> <!--html 文件 结束 标记 --> 


注 : <!--…--> 中 的 内 容 为 注释 。 

结构 上 讲 ，HTML 文件 由 各 种 类 型 的 元 素 组 成 ， 元 素 用 于 组 织 文件 的 内 容 和 指示 文件 
本 绝 大 多 数 元 素 类 似 于 一 个 “容器 ”， 即 它 有 起 始 标记 和 结尾 标记 。 元 素 的 起 始 
标记 是 用 一 对 尖 括 号 括 起 来 的 标记 名 ， 如 <head>、<body> 等 。 元 素 的 结束 标记 是 用 一 对 尖 括 
号 括 起 来 的 、 以 “/” 开 始 的 标记 名 ， 如 </head>、</body> 等 。 在 起 始 标注 和 结尾 标注 中 的 部 
分 是 元 素 体 。 每 一 个 元 素 都 有 名 称 和 可 以 选择 的 属性 ， 元 素 的 名 称 和 属性 都 在 起 始 标注 内 标 
明 ， 其 中 的 属性 名 用 于 控制 元 素 的 输出 格式 。 
每 一 个 HTML 文件 都 以 <html> 标 记 作为 文件 的 开始 ， 而 以 二 et 的 
结束 。 其 他 的 各 种 标记 都 被 包含 在 这 一 对 标记 中 。 有 标记 的 元 素 体内 还 可 

以 嵌入 其 他 的 属性 控制 标记 ， 如 字体 、 色 彩 、 
以 HTML 文件 的 基本 结构 为 例 , 在 ea nt 息 , 该 标记 中 
的 内 容 就 是 在 浏览 器 的 左上 方 显示 网 页 的 标题 ,而 对 网 页 标题 的 属性 控制 标记 (如 <title> 入 
</title> 标 记 ) 就 会 出 现在 这 里 。 <body> 和 <jbody 标 记 之 间 是 在 浏览 器 中 显示 的 正文 内 容 。 这 
部 分 用 来 实 网 网 页 丰富 多 彩 的 各 种 特殊 效果 、 可 以 使 用 的 标记 类 型 及 属性 控制 很 多 ， 也 是 
学 习 HTML 技术 难度 和 灵活 度 要 求 较 高 的 地 方 。 
需要 注意 的 是 , 对 于 HTML 文件 电 的 标记 来 说 , 英文 宝 导 的 大 小 写 不 做 区 分 ， 如 <title 和 
<TITLE> 或 者 <TiTIE> 是 一 样 的 ， “但 对 元 素 体 来 说 ， 芝 怀 人 修 写 是 要 区 分 的 。 在 HTML 文件 
中 ， 有 些 元 素 只 能 出 现在 头 : E 素 中 ， Ce ed 中 。 在 头 元 素 中 的 元 素 
表示 的 是 该 HTML 文件 的 十 般 信息 ， 否 可 检索 等 。 这 些 元 素 书写 的 次 序 是 无 
关 紧 要 的 ， Ee ee 2 出 现在 体 元 素 中 的 元 素 是 对 次 序 























































































































敏感 的 ， 改 变 HTML 文件 中 的 次 序 会 改变 该 HTML 文件 的 输出 形式 。 
2. HTML 文件 中 元 素 的 语法 结构 


一 般 来 讲 ，HTML 的 元 素 有 下 列 3 种 表示 方法 。 

(1) < 元 素 名 > 文件 或 超 文本 </ 元 素 名 >。 

(2) < 元 素 名 属性 名 = 二 “属性 值 ”> 文本 或 超 文本 </ 元 素 名 >。 

(3) 

第 一 种 语法 结构 适用 于 基本 标记 、 标 题 标记 、 文 本 标记 和 表格 标记 等 。 

第 三 种 语法 结构 适用 于 文档 属性 标记 、 字 体 设 置 标记 、 超 链接 标记 、 图 形 元 素 标记 、 表 
格 属性 标记 、 窗 框 标记 和 表单 属性 等 。 

第 三 种 语法 仅 适用 于 一 些 特殊 的 元 素 ， 如 分 段 元素 p， 其 作用 是 通知 浏览 器 在 此 处 分 段 ， 
而 不 需要 界定 作用 范围 , 所 以 它 没有 结尾 标注 。 为 保持 语法 上 的 严谨 , 在 HTML3.0 标准 中 ， 
也 定义 了 </p> 标 注 ， 它 用 于 需要 界定 作用 范围 的 段落 ， 如 增加 对 齐 方式 属性 的 段落 。 以 下 是 
一 段 HTML 代码 。 


<html> 
<head> 




































































ET 
| 
<title> 
This is a example! 
</title> 
</head> 
<body background="P3052032.JPG"> 
<h2 align="left">&nbsp; gnbsp; gnbsp; 静 夜 思 </h2> 
床 前 明月 光 , 疑 是 地 上 霜 .<p> 
举 头 望 明月 , 低头 思 故 乡 .<p> 
</body> 
</html> 


需要 注意 的 是 , 背景 图 像 文件 P3052032.JPG) 需 要 事先 准备 好 , 用 户 当然 可 以 选择 其 他 的 
已 有 的 图 像 文 件 作为 网 页 的 背景 。 打 开 任 何 一 个 文本 编辑 软件 ， 将 上 述 代码 输入 后 ， 命 名 并 
保存 为 6_1.html。 上 面 的 代码 由 Microsoft Internet Explorer 执行 后 如 图 6.3 所 示 。 

结合 图 6.3 所 示 的 显示 效果 对 上 一 段 代码 进行 简单 的 分 析 。 入 PR 

首先 可 以 看 出 这 是 一 段 简 单 的 满足 基本 结构 的 HTML 文件 。 Pe Er = 
<html> 是 文件 起 始 标记 ，<head> 是 头 起 始 标记 ，<title> 是 标题 起 始 
ee 每 一 个 起 始 标记 都 有 二 个 以“/” 前 夜 起 

始 的 结束 标记 。 需 要 注意 的 是 ， 每 一 个 未 记 名 与 其 之 间 不 能 有 hed 
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学 内 萎 明 月 ， 作 类 轩 的 鼠 ， 





出 现在 <head>、</head> 标 记 中 的 <titles、 ie 标记 的 i 
在 济 鉴 的 标题 栏 且 示 文 冰 的 本、 
<title> 与 结束 标记 <jtitle> 之 间 。1 ,人 全 

因为 大 部 分 标记 具有 相同 的 结 构 ， 所 以 对 <body> 标 记 图 6.3 HTML 网 页 效果 
分 进行 较 详 细 的 分 析 ， 和 -个 大 区 4 了 解 。 在 <body></body> 标 记 中 主 
要 完成 了 3 项 功能 .> AN 六 

(D background 局 性 名 。 一 个 个 元 素 可 以 和 Zt, 各 个 属性 用 空格 分 开 ， 属 性 及 其 属性 
值 不 分 大 小 写 。 未 属性 指明 用 什么 方法 来 填充 背景 “三 ”用 来 给 属性 名 赋值 ,“P3052032.JPG” 
是 属性 值 ， 表 示 用 P3052032.JPG 文件 来 填充 背景 这 样 ， 属 性 名 、=、 属 性 值 合 起 来 构成 一 
个 完整 的 属性 ， 代 码 段 “background 二 "P3052032.JPG"” 的 意义 就 是 将 P3052032.JPG 图 像 文 
件 设置 为 网 页 的 背景 。 

(2) “<h2 Men en Snbsp; &nbsp; &nbsp; 静 夜 思 </h2>” 一 段 代 码 中 ，“h2” 用 于 设 
置 标题 字号 大 小 为 2 号 。 属 性 “align” 用 于 设置 文本 内 容 的 对 齐 方 式 ， 属 性 值 “left” 表 示 左 
对 齐 。“&nbsp;” 表 示 插 入 一 个 空格 ， 多 个 空格 可 多 次 使 用 “&nbsp;”。“ 静 夜 思 ”是 要 显 
示 的 文本 内 容 。 所 以 这 一 段 代码 的 作用 是 对 正文 中 的 标题 “静夜 思 ” 设 置 为 左 对 齐 、 前 导 3 
个 空格 、2 号 标题 。 

(3) “ 床 前 明月 光 ， 疑 是 地 上 和 霜 。<p> 举 头 望 明 月 ， 低 头 思 故 乡 。<p>” 一 段 代码 是 以 默 
认 的 字体 方式 分 两 行 显示 正文 内 容 。 其 中 <p> 用 于 创建 一 个 新 的 段落 。 

上 面 是 一 个 简单 的 HTML 的 例子 。 可 以 看 出 ， 一 个 元 素 的 元 素 体 中 可 以 有 另外 的 元 素 。 
如 前 文 所 言 ， 实 际 上 一 个 HTML 文件 仅 由 一 个 HTML 元 素 组 成 ， 即 文件 以 <html> 开 始 ， 以 
</html> 结 尾 ， 文 件 其 余部 分 都 是 HTML 的 元 素 体 。HTML 元 素 的 元 素 体 由 两 大 部 分 ， 即 头 元 
素 <head>…</head> 和 体 元 素 <bod>…</body> 和 一 些 注释 组 成 。 头 元 素 和 体 元 素 的 元 素 体 又 
其 他 的 元 素 和 文本 及 注释 组 成 。 
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3. HTML 中 的 常见 标记 及 其 作用 





在 HTML 标准 中 定义 了 数 十 种 各 种 用 








途 的 标记 ， 学 习 和 掌握 这 些 标记 有 助 于 我 们 深入 了 





解 HTML， 并 进行 复杂 和 细节 化 的 网 页 设计 。 当 然 ， 目 前 流行 的 网 页 编辑 器 (如 Microsoft 














FrontPage) 中 
虑 在 网 页 上 




















， 通 常用 户 可 以 通过 “所 见 即 所 得 ”的 方式 开发 网 页 ， 
需要 显示 什么 样 的 内 容 及 这 些 内容 如 何 布 局 。 在 用 户 利 
行 设计 的 同时 ， 编 辑 器 将 同时 自动 编写 相应 的 HTML 文件 。 这 种 方式 的 使 











户 所 要 做 的 工作 就 是 考 

















“所 见 即 所 得 ”方式 进 
大 大 减轻 了 用 户 












































进行 网 页 开发 的 难度 和 劳动 强度 , 用 户 不 用 花 时 间 去 学 习 和 掌握 枯燥 的 属性 名 及 其 设置 方法 。 
“所 见 即 所 得 ”方式 可 以 满足 一 般 的 网 页 设计 要 求 , 但 对 于 一 些 要 求 较为 复杂 的 网 页 设计 来 说 ， 
利用 HTML 提供 的 标记 进行 网 点 和 网 页 开发 还 是 有 一 定 的 优势 的 。 所 以 ， 对 于 网 页 开发 者 来 
说 ， 早 期 可 以 通过 “所 见 即 所 得 ”方式 进行 框架 式 的 设计 ， 细 节 上 可 借助 标记 语言 进行 再 设 


























表 6-1 HTML 中 的 常用 标记 


测 放 
- 些 常见 的 标记 及 其 功能 见 表 6-1。 

标记 类 型 标记 名 
<html></html> 

基本 标记 | <head></head> 
<body></body> 

标题 标记 | <title></title> 
<body bgcolor 三 ?> 
<body text=?> 

文档 整体 上 PP 


<body link=?> 
<body vlink 三 ?> 
<body alink 一 2> 
<pre></pre>] 


属性 标记 


标记 的 功能 描述 
创建 六 个 HTML 文档 
设置 文档 标题 及 其 他 不 在 Web 页 上 显示 的 信息 
设置 文档 的 可 见 部 分 
设置 文档 标题 栏 中 显示 的 标题 
设置 背景 颜色 $% 使 用 名 称 或 十 六 进 制 值 
设置 文本 英 字 颜色 ， 使 用 名 称 或 十 六 进 制 值 
设置 链接 颜色 ， 使 用 名 称 或 十 7 值 
设置 已 使 用 的 链接 颜色 ， 使 用 名 称 或 十 六 进 制 值 
设置 正 被 击 中 的 链接 颜色 , 使 用 名 称 或 十 六 进 制 值 
创建 预 格式 化 文本 
















































<hi></hl> 创建 最 大 的 标题 
<h6></h6> 创建 最 小 的 标题 
<b></b> 创建 黑体 字 
yt | <i><li> 创建 斜体 字 
| 创建 打字 机 风格 的 字体 
<cite></cite> 创建 一 个 引用 ， 通 常 是 斜体 
<strong></strong> 加 重 一 个 单词 (通常 是 斜体 加 黑体 ) 
<font size=?></font> 设置 字体 大 小 ，1 一 7 
<font color=?></font> 设置 字体 的 颜色 ， 使 用 名 称 或 十 六 进 制 值 
<a href="URL"></a> 创建 一 个 超 链接 
、 | <a href="mailto:Email"></a> 创建 一 个 自动 发 送 电子 邮件 的 链接 
链接 标记 | <a name 二 "NAME"><Aa> 创建 一 个 位 于 文档 内 部 的 闻 位 
<a href="#NAME"></a> 创建 一 个 指向 位 于 文档 内 部 部 位 的 链接 
<p> 创建 一 个 新 的 段落 
排版 格式 | <p align 二 ?> 将 段落 按 左 、 中 、 右 对 齐 
标记 <br> 插入 一 个 回 车 换行 符 





<blockquote></blockquote> 
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从 两 边 缩 进 文本 


第 6 章 如 
1" 






































































































多 媒体 信息 的 组 织 与 管 带 
续 表 
标记 类 型 标记 名 标记 的 功能 描述 
<dl></dl> 创建 一 个 定义 列表 
<ol></ol> 创建 一 个 标 有 数字 的 列表 
排版 格式 | <li> 每 个 数字 列表 项 之 前 加 上 一 个 数字 
标记 <ul></ul> 创建 一 个 标 有 圆 点 的 列表 
<li> 每 个 圆 点 列表 项 之 前 加 上 一 个 圆 点 
<div align=?> 用 于 对 大 块 HTML 段落 排版 ， 也 用 于 格式 化 表 
<img src 一 "name"> 添加 一 个 图 像 
<img src 一 "name" align 一 ?> 排列 对 齐 一 个 图 像 : 左 中 右 或 上 中 下 
图 形 元 素 <img src 王 "name" border 一 ?> 设置 围绕 一 个 图 像 的 边框 的 大 小 
标记 <hr> 加 入 一 条 水 平 线 
<hr size=?7> 设置 水 平 线 的 大 小 (高 度 ) 
<hr width 三 设置 水 平 线 的 宽度 (百分比 或 绝对 像素 点 ) 
<hr noshade> 创建 一 个 没有 阴影 的 水 平 线 
表格 标记 <table></table> 创建 一 个 表格 i 
<th></th> 设置 表格 头 : 一 个 通常 使 用 黑体 居中 文字 的 单元 格 
<table border=#> 设置 围绕 表格 的 边框 的 宽度 
<table cellspacing=#> 设置 表格 单元 格 之 间 的 大 小 
<table cellpadding=#> 设置 表格 单元 格 边框 与 其 内 部 内 容 之 间 的 大 小 
表格 属性 | Sable width 一 #or%> 设置 表格 的 宽度 ;像素 值 或 文档 总 宽度 的 百分比 
标记 ~ | <tr align=?>or<td align= ?3 设置 表格 单元 格 的 水 平 对 齐 方式 ( 左 中 右 ) 
<tr valign=?>or<td valigii=?> 设置 表格 单元 格 的 垂直 对 齐 方式 (上 中 下 ) 
<td colspan =#> 设置 半 个 表格 单元 格 应 跨 占 的 列 数 (默认 为 1) 
<td rowspan 三 过 设置 一 个 表格 单元 格 应 跨 占 的 行 数 (默认 为 1) 
<td nowrap> 荣 止 表格 单 元 格 内 的 内 容 自 动 换行 
<frameset></frameset> 它 可 以 嵌 在 其 他 窗 框 文档 中 
Pe 定义 窗 杠 的 行 才 ， 可 以 使 用 绝对 像素 值 或 高 度 的 百 
<franieset rows="value,value"> 分 比 
窗 框 标记 | _、 a 定义 窗 框 的 列 数 , 可 以 使 用 绝对 像素 值 或 宽度 的 百 
<frameset cols="value,value"> 分 比 
<frame> 定义 一 个 窗 框 内 的 单一 窗口 或 窗口 区 域 
<noframes></noframes> 定义 在 不 支持 窗 框 的 浏览 器 中 显示 的 提示 信息 
<frame src="URL"> 设置 窗 框 内 显示 的 HTML 文档 
<frame name 一 "name"> 命名 窗 框 或 区 域 以 便 别 的 窗 框 可 以 指向 它 
窗 框 属性 | <frame marginwidth 王 过 定义 窗 框 左右 边缘 的 空白 大 小 ， 必 须 大 于 等 于 1 
标记 <frame marginheight=#> 定义 窗 框 上 下 边缘 的 空白 大 小 ， 必 须 大 于 等 于 1 
<frame scrolling= VALUE> 设置 窗 框 是 否 有 滚动 栏 , 可 取 yes、no 及 auto( 默 认 ) 
<frame noresize> 禁止 用 户 调整 一 个 窗 框 的 大 小 
<form></form> 创建 表单 
<select multiple name = "NAME" 创建 一 个 滚动 菜单 ，size 设置 在 滚动 前 用 户 可 以 看 
表单 标记 | 二 ?></select> 到 的 表单 项 数目 
<option> 设置 每 个 表单 项 或 菜单 项 的 内 容 








<select name 一 "NAME"></select> 


创建 一 个 下 拉 菜 单 
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续 表 
- 标记 类 型 标记 名 标记 的 功能 描述 
<textarea name 二 "NAME”cols 二 ?rows | 创建 一 个 文本 框 ，cols 的 值 为 文本 框 的 宽度 ，rows 
=?></textarea> 的 值 为 文本 框 的 高 度 





<input type="checkbox" name= "NAME"> 
<input type = "radio" name= "NAME" 
value="x"> 


创建 一 个 复 选 框 ， 文 字 在 标记 后 面 
创建 一 个 单 选 框 ， 文 字 在 标记 后 面 
创建 一 个 单行 文本 输入 区 域 ，size 设置 以 字符 计 的 








表单 标记 


<input type 一 textname 一 "foo" size=20> 





<input type="submit" value= "NAME"> 


<input type 一 "image" border 一 0 
name= "NAME" src= "name. gif"> 


创建 一 个 submit( 提 交 ) 按 钮 ，NAME 为 按钮 名 称 
创建 一 个 使 用 图 像 的 submit( 提 交 ) 按 钮 
创建 一 个 reset( 重 置 ) 按 钮 
单 ， 一 般 需 要 运行 一 个 CGI 小 程序 ，HTML 仅仅 谍 生 表单 的 表面 样式 。 

需要 说 明 的 是 ，HTML 是 一 门 发 展 很 快 的 语言 ， 早 期 的 HITML 文件 并 没有 如 此 严格 的 结 
构 ， 因 而 现在 流行 的 浏览 器 为 保持 对 早期 HTML 文件 的 兼容 性 ， 也 支持 不 按 上 述 结构 编写 的 
HTML 文件 。 还 需要 说 明 的 是 ， 各 种 浏览 器 对 HTML 元 素 及 其 属性 的 解释 也 不 完全 一 样 ， 本 
中 所 讲 的 元 素 、 元 素 的 属性 及 其 输出 以 下 浏览 器 为 准 。 


6.3.3 ”HTML 的 应 用 

















<input type="reset"> 


对 于 功能 性 的 





注 














-个 多 媒体 网 页 中 可 能 包括 背景 .文本 内 容 、 表 格 、 背 景 音乐 、 音 乐 链 接 、 视 频 链接 、 
嵌入 的 图 像 或 图 像 链接 等 ， 表 现 力 本 分 丰富 。HTML 用 于 对 多 媒体 信息 进行 组 织 并 以 网 页 形 
式 展示 给 用 户 。 目 前 在 互联 网 十 的 大 多 数 网 页 是 由 RIML 编写 的 。 利用 HTML 建立 网 页 ， 可 
以 使 用 任意 一 个 文本 编辑 器 或 专用 软件 。 本 节 的 内 容 以 FrontPage 2000 为 工具 ， 讲 述 HTML 
在 网 页 制作 中 的 使 用 方法 ， 如 文本 展示 、 插 头 表 烙 x 音频、 视频 等 多 媒体 信息 。 

需要 说 明 的 是 , FrontPage 2000 既 提 供 了 ”所 见 即 所 得 ”的 网 页 设计 界面 , 又 提供 了 HTML 
的 编辑 功能 ， 用 户 可 以 两 种 方式 进行 设计 工作 。 下 面 各 例 中 的 标记 功能 大 家 可 查阅 表 6.1 中 
所 列 的 内 容 。 在 FrontPage 2000 中 ， 每 一 个 网 页 都 具有 如 下 的 基本 形式 。 


<html> 














<head> 

<meta http-equiv="Content-Type" content="text/html; charset=gb2312"> 
<meta name="GENERATOR" content="Microsoft FrontPage 4.0"> 

<meta name="ProgId" content="FrontPage.Editor.Document"> 

<title>New Page 1</title> 

</head> 


<body> 
</body> 
</html> 


对 于 在 网 页 中 插入 的 新 的 多 媒体 信息 ,全 部 放 入 <body>…</body> 这 一 对 标记 中 。 在 以 下 
的 各 个 例子 中 ， 只 说 明 应 该 在 <body>…</body> 标 记 中 插入 的 代码 ， 用 户 在 插入 新 代码 并 保存 
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后 ， 可 在 浏览 器 中 查看 运行 结果 ， 有 具体 内 容 可 在 上 机 时 验证 。 
1. 在 网 页 中 展示 不 同 效果 的 文本 信息 
1) 在 网 页 中 置 入 文本 内 容 
可 在 <body>…</body> 标 记 插入 以 下 代码 。 


保存 并 在 浏览 器 中 运行 ， 得 到 如 图 6.4 4 有 宗 的 显示 结果 。 
一 个 党 束 的 ML 特地 应 仿生， 
ee 


2) 在 网 页 Ne 调用 7 
可 在 <body Ce 


图 6.4 Ban 








人 多 天体 技 术 坟 黄 应 用 (第 之 乒 ) 


保存 并 在 浏览 器 中 运行 ， 得 到 如 图 6.5 所 示 的 显示 结果 。 在 本 例 中 ， 如 果 改 变 direction 
三 "up" 标 记 的 值 ， 可 改变 文字 移动 的 方向 。 其 中 up 表示 向 上 移动 ，down 表示 向 下 ，left 表示 
向 左 ，right 表示 向 右 。 








迎 谢 
月 区 光 
6.5 动态 文字 
2， 在 网 页 中 插入 带 边框 的 图 像 
在 <body>…</body> 标 记 插入 以 下 代码 。 


<div align="center"> 严 
<table borderColor="#009933" 3 cellPadding="1" 
align="center" border="6"> 


<tbody> 忆 
<tr> A 
<td> 
<p align= i bi 信 src="101-1.JPG" width="321" 
height="236"></P> 


</td> 
ER Sp RS 
</tbody> NAN a 
</table> SN 、 六 
</div> -rr wz 


其 中 src 二 "101-1.JPG" 中 的 101-1.JPG 是 由 用 户 自己 指定 的 一 幅 图 像 , 具体 位 置 (可 以 是 网 
络 地 址 或 本 机 地 址 )= 文 件 名 与 内 容 由 用 户 自行 设 定 保存 代码 并 运行 后 如 图 6.6 所 示 。 





6.6 在 网 页 中 插入 图 像 


3， 在 网 页 中 插入 音乐 
在 <body>…</body> 标 记 插入 以 下 代码 。 


<EMBED src=file:///D:/MyHeartWillGoOn.mp3 width=350 height=40 type= audio/ 
x-pn-realaudio-plugin controls="ControlPanel,StatusBar"AutoStart="true" Loop= 
Struen> 
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其 中 “file:///D:/MyHeartWillGoOn.mp3” 是 由 用 户 指定 的 ， 具 体位 置 (可 以 是 网 络 地 址 或 
本 机 地 址 )、 文 件 名 与 内 容 由 用 户 自行 设 定 。 保 存 代 码 并 运行 便 可 听 到 播放 的 音乐 ， 播 放 控制 
各 按钮 均 可 由 用 户 调节 ， 如 图 6.7 所 示 。 





6.7 ”在 网 页 中 插入 音乐 
4. 在 网 页 中 插入 视频 
在 <body>…</body> 标 记 插入 以 下 代码 。 





其 中 “file:/W/E:/DSCF0109.AVI” 是 由 用 户 指定 的 , 具体 位 置 是 网 络 地 址 或 本 机 地 址 )、 
文件 名 与 内 容 由 用 户 自行 设 定 。 全 人 生生 和 全 可 生生 风 内 播放 控制 各 按钮 均 可 
由 用 户 调节 ， 如 图 6.8 所 示 。 


6.8 在 网 页 中 插入 视频 
5. 在 网 页 中 插入 表格 
在 <body>…</body> 标 记 插 入 以 下 代码 。 





i 多 媒体 技术 及 其 应 用 (第 2 版 ) 
<td> 丁 一 </td> 
<td> 男 </td> 
<td>1985/06/01</td> 
<td> 计 算 机 学 院 03 级 应 用 1 班 </td> 
<td> 音 乐 </td> 
<td>6 号 楼 401 室 </td> 
<td>13911111111</td> 

过 /> 
</tbody> 
</table> 


保存 代码 并 运行 可 见 表格 ， 如 图 6.9 所 示 。 








pS 
图 6.9 在 网 页 中 插入 表格 /| 


除了 以 上 内 容 外 ，HTML 的 许多 实用 功能 和 高 级 功能 这 没 有 介绍 ， 有 兴趣 的 读者 可 进 一 
步 参阅 HTML 技术 的 有 关 书 籍 。 , 不 二 


N 


AL 
RS 


6.4 可 扩展 的 标记 语言 XML 





6.4.1 XML 简介 


MAA 








XML(Extensible Markup arguade, 可 扩 展 的 标记 语言 二 套 定义 语义 标记 的 规则 , 这 些 
标记 将 文档 分 成 许多 部 件 过 此 部 件 加 以 标示 。 。 它 也 是 元 标记 语言 即 定义 了 用 于 定义 其 
他 与 特定 领域 有 关 的 .语义 的 、 结构 化 的 标记 语言 的 句法 语言 言 。 

XML 来 源 于 SGML7SGML 是 - -种 比 HTML 更 早 的 标记 语言 标准 .SGML 全 称 是 Standard 
Generalized Maikup Language( 通 用 标记 语言 标准 )。SGML 有 非常 强大 的 适应 性 ， 也 正 是 因为 
同样 的 原因 ， 导 敏 在 小 型 的 应 ) 用 中 难以 普及 。HTML 和 XML 同样 衍生 于 SGML: XML 可 以 
被 认为 是 SGML 的 一 个 子 集 ， 而 HTML 是 SGML 的 一 个 应 用 

XML 是 从 1995 年 开始 有 其 雏形 ， 并 向 W3C( 万 维 网 联盟 ) 提 案 ， 而 在 1998 年 2 月 发 布 为 
W3C 的 标准 (XML1.0)，HTML 和 XML 都 源 自 于 SGML。 最 先 成 功用 于 Internet 的 是 HTML， 
但 随 着 HTML 在 Internet 中 的 大 量 使 用 ， 人 们 也 发 现 仅仅 靠 HTML 单一 文件 类 型 来 处 理 千 变 
万 化 的 文档 和 数据 已 经 不 够 ， 而 且 HTML 本 身 语法 十 分 不 严密 ， 严 重 影响 网 络 信息 传输 和 共 
享 。 例 如 ，HTML 的 问题 有 以 下 几 个 。 

(1) 不 能 解决 所 有 解释 资料 的 描述 问题 一 一 影音 文档 或 化 学 公式 、 音 乐 符号 等 其 他 形态 的 
内 容 的 表示 。 

(2) 效能 问题 一 一 需要 下 载 整 份 文件 ， 才 能 开始 对 文件 做 搜寻 。 

(3) 扩充 性 、 弹 性 、 易 读 性 均 不 佳 。 

为 了 解决 以 上 问题 ， 专 家 们 使 用 SGML 精简 制作 ， 并 依照 HTML 的 发 展 经 验 ， 产生 一 套 
使 用 规则 严谨 ， 但 是 简单 的 描述 资料 语言 XML。 

XML 被 广泛 用 来 作为 跨 平台 之 间 交 互 数据 的 形式 ， 主 要 针对 数据 的 内 容 ， 通 过 不 同 的 格 
式 化 描述 手段 XSLT、CSS 等 ) 可 以 完成 最 终 的 形式 表达 (生成 对 应 的 HTML、PDF 或 者 其 他 的 
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文件 格式 )。XML 的 优点 是 ， 可 以 广泛 运用 于 Web 的 任何 地 方 ， 可 以 满足 网 络 运用 的 各 种 需 
求 ; XML 的 代码 更 加 清晰 、 严 格 和 便于 阅读 理解 ， 使 编程 更 简单 。 

例如 ， 在 HTML 中 ， 一 首 歌 可 能 是 用 定义 标题 、 定 义 数据 、 无 序 的 列表 和 列表 项 来 描述 
的 。 但 是 事实 上 这 些 项 目 没有 一 件 是 与 音乐 有 关 的 。 用 HTML 定义 的 歌曲 可 能 如 下 。 





而 在 XML 中 ， 同 样 的 数据 可 能 标记 为 : 





在 这 个 清单 中 没有 使 用 通用 的 标记 ， <del, 而 是 使 用 了 具有 意义 的 标记 ， 如 
<SONG>、 <TIRUEYJsCOMPOSER> 和 < 将 AR 等 这 种 用 法 具有 许多 优点 ， 包 括 源码 易于 
被 人 阅读 ， 使 大 能 够 看 出 作者 的 含义 。 六 

XML 和 HTML 的 最 大 区 别 在 于 ，HTML 是 一 个 定型 的 标记 语言 ， 它 用 固有 的 标记 来 描 
述 ， 显 示 网 页 内 容 ， 如 <h1> 表 示 行 首 标题 ， 有 固有 的 尺寸 ; 而 相对 而 言 ，XML 就 没有 固定 的 
标记 ，XML 不 能 描述 网 页 的 具体 外 观 、 内 容 ， 它 只 是 描述 内 容 的 数据 形式 和 结构 。 即 HTML 
将 数据 和 显示 混在 一 起 ， 而 XML 则 将 数据 和 显示 分 开 。 因 此 ， 不 能 用 XML 直接 写 网 页 ， 即 
便 包 含 了 XML 数据 也 不 能 直接 在 网 页 上 显示 ， 依 然 要 转换 成 HTML 人 
示 。 另 外 ，XML 并 不 是 真正 意义 上 的 标记 语言 ， 它 只 是 创建 标记 语言 的 元 语言 。XML 的 用 
途 比 HTML 的 用 途 要 广泛 得 多 。 但 XML 并 不 是 HTML 的 蔡 代 品 ,也 不 是 HIML 的 升级 ， 它 
只 是 HTML 的 补充 ， 为 HTML 扩充 更 多 功能 ， 在 较 长 一 段 时 间 里 HTML 还 将 会 继续 使 用 。 


6.4.2 XML 的 结构 
为 了 说 明 XML 的 结构 及 语法 ， 先 看 如 下 的 XML 程序 。 


二 





这 是 一 个 典型 的 XML 文件 , 编辑 好 后 保存 为 一 个 以 .xml 为 扩展 名 的 文件 。 一 个 XML 文 
件 通常 包含 文件 头 和 文件 体 两 大 部 分 


少 的 ， 关 于 DTD 声明 将 在 后 续 的 内 容 中 介绍 ， 而 XML 声明 是 必须 要 有 的 ， 以 使 文件 符合 
XML 的 标准 规格 。 站 - 
上 例 中 第 一 行 代码 即 为 XML 声明: 


1; 交 件 头 
XML 文件 头 由 XML 声明 与 DTD 文件 类 型 声明 组 成 。 





其 中 ，“<2” 代表 一 条 指令 的 开始 ，"? 条 指令 的 结束 ，“xml” 代表 此 文件 是 XML 
文件 :“version 王 "1.0"” 代 表 此 文人 te 1.0 标准 ;“encoding 二 "gb2312"” 代 表 此 文件 
所 用 的 字符 集 ， 默 认 值 为 ee 该 文件 中 要 须 将 此 值 设 定 为 gb2312。 


注意 : XML 声明 必 有 档 的 第 一 行 。 

2. 文件 体 ”> 人 交 

文件 体 中 XML 文人 的 内 容 - 元 素 是 XML 文件 内 容 的 基本 单元 。 从 语法 
， 一 个 元 素 和 次 之 个 起 始 标记 、 一 个 结束 标记 及 标记 之 间 的 数据 内 容 。 


XML 元 素 与 HTML 元 素 的 格式 基本 相同 ， 其 格式 如 下 。 





所 有 的 数据 内 容 都 必须 在 某 个 标记 的 开始 和 结束 标记 内 ， 而 每 个 标记 又 必须 包含 在 另 一 
个 标记 的 开始 与 结束 标记 内 ， 形 成 嵌 套 式 的 分 布 ， 只 有 最 外 层 的 标记 不 必 被 其 他 的 标记 所 包 
含 。 最 外 层 的 是 根 元 素 (root)， 又 称 文件 (document) 元 素 ， 所 有 的 元 素 都 包含 在 根 元 素 内 。 通 
过 上 例 可 以 看 到 ， 文 件 主体 是 由 开始 的 《参考 资 料 ) 和 结束 的 〈/ 参 考 资 料 ) 根 元 素 控制 标记 
组 成 ，( 书 籍 是 作为 直属 于 根 元 素 下 的 “ 子 元 素 ” 在 (书籍 下 又 有 〈 名 称 )、( 作 者 )、( 价 
格 〉 这 些 子 元 素 。 货币 单位 是 (价格 〉 元 素 中 的 一 个 “属性 ”,“ 人 民 币 ” 则 是 “属性 值 ”。 《1-- 
此 书 即 将 出 版 --) 这 一 句 同 HTML 一 样 ， 是 注释 ， 在 XML 文件 里 ， 注 释 部 分 是 放 在 “《!--” 
与 “--)” 标 记 之 间 的 部 分 。 

可 以 看 到 ，XML 文件 是 相当 简单 的 。 同 HTML 一 样 ，XML 文件 也 是 由 一 系列 的 标记 组 
成 ,不 过 ，XML 文件 中 的 标记 是 我 们 自 定义 的 标记 ， 具 有 明确 的 含义 ， 可 以 对 标记 中 的 内 容 
的 含义 做 出 说 明 。 
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6.4.3 XML 的 基本 语法 

对 XML 文件 有 了 初步 的 印象 之 后 ， 下 面 详细 介绍 XML 文件 的 基本 语法 。 

1. 注释 

XML 的 注释 与 HTML 的 注释 相同 ， 以 “<!--” 开 始 ， 以 “-->” 结 束 。 

2. 区 分 大 小 写 

在 HTML 中 是 不 区 分 大 小 写 的 ， 而 XML 区 分 大 小 写 ， 包 括 标记 ， 属 性 ， 指 令 等 。 

3， 标记 

XML 标记 与 HTML 标记 相同 ,“<” 表 示 一 个 标记 的 开始 ,“>” 表示 一 个 标记 的 结束 。 
XML 中 只 要 有 起 始 标记 ， 就 必须 有 结束 标记 ， 而 且 在 使 用 堪 套 结构 时 ， 标 记 之 间 不 能 交叉 。 

在 XML 中 不 含 任何 内 容 的 标记 称 为 空 标记 ， 格式 为 < 相生 入 > 

4. 属性 WY 

ns 

5.， 实体 引用 


实体 引用 是 指 分 析 文 想 4 会 被 字符 六 所 取代 的 元 素 ， 实体 引用 用 于 XML 文档 中 的 特殊 字 
符 ， 否则 这 些 字符 会 被 解释 为 元 素 的 组 成 部 分 。 例如 ， 如 果 村 冯 示 “<”， 需 要 使 用 实体 引用 
“&lt”， 否 则 会 被 解释 为 一 个 标记 的 起 始 。 

XML 中 有 5 个 预定 义 的 实体 引用 ， 见 表 6.2。 


表 6-2 XM 预定 久 的 实体 引用 























V _&lt; 2 


< 

&gt; > 

&quot; 本 
Rapos; 

&amp; & 





6. CDATA 
在 XML 中 有 一 个 特殊 的 标记 CDATA, 在 CDATA 中 所 有 文本 都 不 会 被 XML 处 理 器 解释 ， 
直接 显示 在 浏览 器 中 ， 使 用 方法 如 下 。 
<! [CDATA[ 
这 里 的 内 容 可 以 直接 显示 . 
WS 
7. 处 理 指令 
处 理 指令 使 用 来 给 处 理 XML 文件 的 应 用 程序 提供 信息 的 ， 处 理 指令 的 格式 如 下 。 
<? 处 理 指令 名 称 处 理 指令 信息 ?> 
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ce 例如 ，XML 声明 就 是 一 条 处 理 指令 : 


其 中 ,“xml” 是 处 理 指令 名 称 ，version 二 "1.0" encoding 王 "gb2312" 是 处 理 指令 信息 。 
6.4.4 XML 的 显示 方式 


单独 用 XML 不 能 显示 页 面 ， 因 为 XML 是 将 数据 和 格式 分 离 的 。XML 不 知 如 何 显示 ， 
必须 有 辅助 文件 来 帮助 实现 。XML 取消 了 所 有 标记 ， 包 括 font，color，p 等 风格 样式 定义 标 
志 ， 因 此 ，XML 全 部 是 采用 类 似 DHTML 中 CSS 的 方法 来 定义 文档 风格 样式 。XML 中 用 来 
设 定 显示 风格 样式 的 文件 类 型 如 下 。 


1. CSS 


CSS 全 称 是 Cascading Style Sheets( 层 梧 样 式 表 )。 利 用 CSS 可 以 设 定 XML 文件 的 显示 方 
式 ， 即 在 XML 文件 的 头 部 ，XML 声明 的 下 面 加 入 如 下 一 条 语句 


例如 ， 有 下 列 XML 文档 。 S 





该 XML 文件 中 没有 定义 屏幕 显示 格式 , 下 面 通过 例子 来 介绍 如 何 利用 CSS 来 显示 XML 
文件 。 首 先 建立 一 个 CSS 文件 (flowers.css: 显示 XML 文件 的 CSS 样式 )， 代 码 如 下 。 





然后 , 在 flowers.xml 文件 中 使 用 这 个 CSS 样式 , 即 在 flowers.xml 文件 中 的 XML 声明 下 
面 加 入 如 下 语句 。 


”<?xml:stylesheet type="text/css" href="flowers.css"?> 
利用 CSS 显示 XML 文件 的 完整 程序 代码 如 下 。 





DA 
VN 图 6.10 和 ss 显示 XML 文件 


用 CSS A XML 文件 时 ， 不 具备 任何 选择 性 ， 即 根 元 素 之 下 的 所 有 数据 都 会 被 全 部 
显示 ， 不 能 改变 原文 件 的 结构 和 内 容 的 顺序 。 另 外 ，CSS 并 不 支持 中 文 标记 ， 因 为 CSS 不 是 
专门 为 XML 开发 的 样式 语言 ， 而 下 面 要 介绍 的 XSL 就 可 以 。XSL 是 特别 为 XML 设计 的 ， 
它 比 CSS 更 为 复杂 。 


2. XSL 


XSL 全 称 是 Extensible Stylesheet Language( 可 扩展 样式 语言 ), 是 将 来 设计 XML 文档 显示 
样式 的 主要 文件 类 型 。 它 本 身 也 是 基于 XML 语言 的 。 使 用 XML 可 以 灵活 地 设计 XML 文档 
的 显示 样式 ， 文 档 将 自动 适应 任何 浏览 器 和 PDA( 便 携 式 计算 机 )。 

XML 也 可 以 将 XSL 转化 为 HTML， 那 样 浏览 器 也 可 以 浏览 XML 文档 了 。 

利用 XSL 来 设 定 XML 文件 的 显示 方式 ， 即 在 XML 文件 的 头 部 ，XML 声明 的 下 面 加 入 
如 下 一 条 语句 

”<?xml:stylesheet type="text/xsl" href="xsl 文 件 的 URL*?> 


下 面 通过 例子 来 介绍 如 何 利 用 XSL 来 显示 XML 文件 。 首 先 建立 一 个 XSL 文件 
(flowers.xsl: 显示 XML 文件 的 XSL 文件 )， 代 码 如 下 。 


人 








可 以 看 出 ， 一 个 XSL 文件 就 如 一 个 空 的 HTME 2 通过 填充 一 个 XML 文件 产生 一 个 
传统 的 HTML 文件 。 

一 个 XSL 文件 首先 必须 有 一 个 XW 2 行 )， 因 为 XSL 实际 上 是 一 种 特殊 的 
XML 文件 。XSL 的 根 元 素 是 xsl: styleshe \ 即 一 个 XSL ee 须 以 <xsl:stylesheet> 标 记 开 始 ， 
以 </xslistylesheet> 标 记 结束 ，xmlnstxsl 属性 用 于 设 定 XSE 人 

XSL 的 根 元 素 通常 是 由 记 er 例 中 只 包含 单一 样板 ， 它 是 由 
<xsl:template> 标 记 开始 ， Wxst: template> 标 记 结束 ， match 属性 可 以 在 XML 文件 中 选取 
符合 条 件 的 节点 ， 即 设 定 样板 名 称 ， 对 于 最 上 层 样板， match 设 为 “/”， 代 表 整 个 XML 文件 
的 根 元 素 。 f bP 不 以 AS 
然后 是 从 XI 件 中 取得 所 需 的 数据 ,取得 数据 最 简单 的 方法 如 下 。 





若 要 取得 多 个 元 素 ， 则 要 使 用 xsl:for-each 元 素 ， 格 式 如 下 。 





接 下 来 ， 要 在 flowers.xml 文件 中 使 用 这 个 XSL 文件 ， 即 在 flowers.xml 文件 中 的 XML 
声明 下 面 加 入 如 下 语句 。 





利用 XSL 显示 XML 文件 的 完整 程序 代码 如 下 。 








此 例 在 浏览 器 中 的 显示 效果 如 图 6.11 所 示 。 论 

















Ww 
用 常用 的 编辑 器 XML 与 XSL ， 如 Windows 中 的 “记事 本 ”软件 ， 保 存 
时 分 别 取 扩展 名 为 xsl 即 可 ， 如 上 ers.xml 和 flowers.xsl。 然 后 在 Windows 
中 双击 该 扩展 名 是 . 文件 名 即 可 在 浏览 器 中 运行 XML 程序 并 显示 运行 结果 。 
6.5 ”多 媒体 数据 库 


建立 数据 库 的 目的 是 为 了 便于 对 数据 进行 管理 。 传 统 的 数据 库 管理 系统 在 处 理 结构 化 数 
据 ， 如 文字 和 数值 信息 等 方面 是 很 成 功 的， 但 是 处 理 非 结 构 化 的 多 媒体 数据 (如 图 形 、 图 像 和 
声音 等 ) 时 ， 传 统 的 数据 库 系统 遇 到 了 很 多 困难 。 研 究 和 建立 能 处 理 非 结构 化 数据 的 新 型 数据 
库 一 一 多 媒体 数据 库 是 当务之急 。 


6.5.1 多 媒体 数据 库 简介 


多 媒体 数据 库 (Multimedia Data Base，MDB) 是 指 能 够 存储 、 处 理 和 检索 文本 、 图 形 、 图 
像 、 音 频 、 视 频 等 多 种 媒体 信息 的 数据 库 。 多 媒体 数据 库 是 计算 机 多 媒体 技术 、Internet 技术 、 
网 络 技术 与 传统 数据 库 技术 相 结合 的 产物 。 由 于 其 对 文本 、 图 形 、 图 像 、 音 频 和 影视 处 理 与 
数据 库 的 独立 性 、 安 全 性 等 优点 的 结合 ， 使 得 多 媒体 数据 库 的 应 用 前 景 十 分 广泛 ， 如 Internet 
上 静态 图 像 的 检索 系统 ， 具 有 声音 、 图 像 的 多 媒体 户籍 管理 系统 等 。 数 据 库 管 理 系统 的 主要 
任务 是 提供 信息 的 存储 和 管理 。 
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一 多 苦 你 找 术 及 应 用 (第 二 服 ) 
一 1. 多 媒体 数据 库 管理 系统 的 特点 


多 媒体 数据 库 通过 多 媒体 数据 库 管理 系统 (MDBMS) 来 实现 对 数据 的 管理 和 操作 。 多 媒体 
数据 库 要 求 数据 库 能 管理 分 布 在 不 同 辅助 存储 媒体 上 的 海量 数据 。 除 了 需要 大 的 存储 容量 
外 ，MDBMS 处 理 连 续 的 数据 时 还 要 满足 实时 性 的 要 求 。 一 个 MDBMS 的 设计 必须 满足 上 述 
要 求 。 具 体 地 讲 ，MDBMS 具有 以 下 特点 。 

(1) 信息 的 海量 存储 与 处 理 : 多 媒体 信息 的 数据 量 比较 大 , 尤其 是 音频 和 视频 信息 的 数据 
量 更 大 ， 这 要 求 MDBMS 能 够 提供 大 量 的 存储 空间 ， 并 提供 对 这 些 多 媒体 数据 的 相应 操作 。 

(2) 非 原始 性 特征 : 多 媒体 数据 在 进入 数据 库 前 一 般 要 经 过 诸如 压缩 编码 等 处 理 过 程 , 这 
直接 导致 了 它 与 原始 数据 存在 一 定 程度 的 差异 ， 而 这 种 差异 是 传统 数据 库 所 没有 的 。 工 程 应 
用 中 用 户 可 根据 该 数据 库 的 具体 应 用 ,将 压缩 数据 作为 常用 数据 ， 而 原始 数据 作为 后 备 资料 。 
(3) 信息 重组 织 : MDBMS 应 支持 将 复合 的 多 媒体 信息 在 各 通道 分 离 后 存 入 数据 库 。 例 
的 重信 四 和 作用 罗素 你 用 作 首 竺 人 让 及 提 人 存储 到 数据 库 中 ， 在 需 
要 时 再 将 分 离 的 信息 重新 “组 装 ”后 输出 。 NE 

(4) 长 事务 : 相对 于 传统 数据 库 , 在 MDBMS 中 , 对 数据 量 特别 大 的 音 视频 数据 的 处 理 (如 
存储 、 播 放 等 ) 需 要 较 长 的 时 间 ， 这 就 是 长 事务 。 长 事务 楼 求 系统 在 可 靠 的 方式 下 耗费 大 量 的 
了 条 以 全 人 办 大 的 台 如 音频 人 息 的 关机 等 是 长 画 的 型 

(5) 数据 实时 传输 : 音 视频 信息 在 访问 ( 小 ) 中 ， 对 实时 性 要 求 很 高 ， 这 要 求 MDBMS 
对 连续 数据 的 读 和 写 操作 必须 实时 完成 ;连续 数据 的 传输 应 优先 于 其 他 数据 库 的 管理 行为 。 

(6) 干预 系统 资源 的 调度 : 传统 库 管理 系统 不 王 预 操作 系统 的 工作 , 但 在 MDBMS 
中 ， 因 为 要 处 理 大 数据 量 的 信息 和 长 事务 等 方面 的 特性 ， 因 此 MDBMS 应 能 参与 扣 作 系统 
相关 资源 的 调度 。 > A 

0) BLOB(BinaryLargs ObjeeD 类 型 的 结构 化 问题 ，BLOB 是 数据 库 系统 的 多 媒体 信息 丰 
储 类 型 ， 用 来 存储 如 文本 文件 ， 以 及 各 种 糙 式 的 图 片 、 音 频 、 视 频 文 件 等 大 数据 量 信息 的 字 
SN 4GB)。 按照 数据 的 存储 方式 不 同 可 以 将 其 分 为 内 部 LOB 和 外 部 LOB 
两 种 。BLOB 属性 具有 大 多 数 DBMS 中 的 LONG 和 LONG RAW 字段 类 型 2 倍 的 数据 容量 ， 
且 提 供 了 顺序 和 随机 两 种 数据 访问 方式 。 但 BLOB 本 身 不 支持 结构 化 ， 因 此 应 对 BLOB 进行 
结构 化 处 理 。 

(8) 描述 性 的 搜索 方法 : 多 媒体 数据 的 查询 方法 不 同 于 文本 查询 ， 它 是 基于 一 个 描述 性 
面向 对 象 的 查询 格式 。 这 种 搜索 方法 与 所 有 媒体 都 相关 ， 包 括 视频 和 音频 。 
2. 多 媒体 数据 库 的 操作 


与 传统 数据 库 的 操作 相似 ， 在 多 媒体 数据 库 系 统 中 ， 对 每 个 媒体 可 能 有 不 同类 型 的 操作 ， 
如 和 输入、 输出、 查询、 修改、 删除 ， 比 较 和 求 值 等 。 

(1) 输入 操作 : 将 多 媒体 数据 写 入 数据 库 中 。 根 据 媒体 信息 的 不 同 ,可 能 在 多 媒体 数据 的 
后 面 还 需要 附加 描述 性 数据 以 便于 查询 操作 。 对 音频 和 视频 信息 输入 操作 过 程 中 ， 往 往 还 需 
要 为 MDBMS 选择 合适 的 服务 器 和 磁盘 。 

(2) 输出 操作 : 将 多 媒体 数据 从 数据 库 读 取出 来 。 

(3) 修改 操作 : 根据 查询 的 结果 ， 对 多 媒体 数据 库 中 的 多 媒体 信息 进行 编辑 。 

(4) 删除 操作 : 将 查询 到 的 信息 从 多 媒体 数据 库 中 删除 。 在 数据 删除 操作 期 间 ， 注 意 必 须 
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多 媒体 信息 的 组 织 与 | 


保持 数据 的 一 致 性 ， 当 一 条 记录 的 原始 数据 被 删除 后 ， 所 有 依赖 于 这 个 原始 数据 的 其 他 数据 
也 将 被 删除 。 
(5) 查询 操作 : 对 多 媒体 数据 库 的 查询 需要 针对 不 同 媒体 信息 的 特点 进行 , 是 基于 信息 内 
容 的 、 不 精确 匹配 查询 。 常 见 的 查询 方式 有 利用 特定 媒体 中 的 单个 模板 和 存储 的 数据 进行 对 
比 的 查询 方法 、 特 定 系统 中 的 模式 识别 查询 方法 、 基 于 内 容 描 述 的 数据 比较 查询 方法 等 。 
(6) 求 值 操作 : 对 原始 数据 和 记录 数据 进行 求 值 的 目标 是 产生 相关 的 描述 性 数据 。 例 如 ， 
当 要 求 对 纸 质 文字 文档 进行 存储 时 ， 可 以 使 用 字符 识别 软件 (OCR) 进 行 处 理 。 


6.5.2 ”多 媒体 数据 库 体系 结构 


多 媒体 数据 库 的 体系 结构 可 分 为 层次 结构 和 组 织 结构 。 多 媒体 数据 库 的 层次 结构 可 分 为 
媒体 支持 层 、 存 取 与 存储 数据 模型 层 、 概 念 数据 模型 层 和 多 媒体 用 户 接口 层 4 层 。 多 媒体 数 
据 库 的 组 织 结构 可 分 为 协作 型 、 集 中 统一 型 、 RS 


1， 多 媒体 数据 库 的 层次 结构 


多 媒体 数据 库 的 层次 结构 是 对 多 媒体 数据 库 体系 结 pn 冰 简 述 ， 它 从 宏观 上 描述 多 媒 
体 数据 库 的 组 成 及 各 部 分 所 应 承担 完成 的 功能 。 SN 库 的 层次 结构 如 图 6.12 所 示 。 

图 6.12 中 不 同 层 的 主要 功能 如 下 。 

CD 媒体 支 持 层 ， 该 必 针 对 各 种 媒体 的 特殊 竹 质 ， 
实现 对 媒体 相应 的 分 割 、 识 别 、 变 换 等 操作 ， 并 确定 
物理 存储 的 位 置 和 方法 ， 以 实现 对 下 纪 汪 的 最 本 
数据 的 管理 和 操纵 。 

CD a 
逻辑 存储 与 存 取 。 在 该 层 中 ， 各 种 媒体 数据 的 包 
置 安排 、 相 互 的 内 容 关联 、 特征 与 数据 的 关系 
拉 的 建 竺 等 志 刘 的 存 了 与 存 人 和 -一 一 一 一 
行 描述 。 > | | 康信 文 持 导 | 

03) 概念 数据 模型 层 : 实现 对 客观 世界 用 多 媒体 数 
es 车 述 。 在 该 层 中 ， 通 过 概念 数据 模型 为 上 “图 612 多 媒体 数据 库 的 层次 结构 示意 图 
层 的 用 户 接口 、 下 层 的 多 媒体 数据 存储 和 存 取 建 立 起 一 个 在 逻辑 上 统一 的 通道 。 

存 取 与 存储 数据 模型 层 和 概念 数据 模型 屋 也 可 以 通称 为 数据 模型 层 。 

(多 媒体 用 户 接口 层 ; 完成 用 户 对 多 媒体 信息 的 查询 描述 并 得 到 查询 结果 。 用 户 需 要 利 
能 够 使 系统 接受 的 方式 描述 查询 的 内 容 ， 对 查询 得 到 的 结果 系统 需要 按 用 户 的 需求 进行 多 
媒体 化 的 展现 。 


2. 多 媒体 数据 库 的 组 织 结构 


在 实际 应 用 中 , 常常 需要 构建 不 同 的 多 媒体 数据 库 应 用 系统 来 需要 满足 不 同 的 应 用 需求 。 
构建 应 用 系统 时 所 采用 的 系统 结构 ， 就 是 多 媒体 数据 库 的 组 织 结构 的 具体 化 。 根 据 应 用 系统 
的 构建 方式 不 同 ， 可 以 将 多 媒体 数据 库 的 组 织 结构 分 为 以 下 4 种 。 

1) 协作 型 

协作 型 (也 称 联邦 型 ) 对 不 同 种 类 的 媒体 数据 分 别 建立 单独 的 数据 库 , 每 一 种 媒体 的 数据 库 
都 有 自己 独立 的 数据 库 管理 系统 。 虽 然 它们 是 相互 独立 的 ， 但 可 以 通过 相互 通信 进行 协调 和 
执行 相应 的 操作 。 
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章 . 肥 .， ，. 
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一 一 | 六 


一 一 “大 ) 


_ 一 特点: 对 多 媒体 数据 库 的 管理 是 分 开 进 行 的 , 可 以 利用 现 有 的 研究 成 果 直 接 进行 “组 装 ”， 
”每 一 种 媒体 数据 库 的 设计 也 不 用 考虑 与 其 他 媒体 的 区 别 和 协调 。 
缺点 : 对 不 同类 型 媒体 的 联合 操作 要 由 用 户 自己 设法 来 完成 ， 使 得 多 种 媒体 信息 的 联合 
操作 、 合 成 处 理 、 概 念 查询 等 操作 完成 难度 较 大 。 
协作 型 多 媒体 数据 库 的 组 织 结构 如 图 6.13 所 示 。 








5 
图 6.13 协作 型 多 媒体 数据 库 系统 结构 > 
2) 集中 统一 型 AAS 

集中 统一 型 结构 中 只 存在 一 个 单一 的 多 媒体 数据 库 和 单一 的 MDBMS， 并 由 系统 对 各 和 
息 统 一 建 模 ， 它 把 各 种 媒体 的 管理 与 操纵 集束 到 一 个 数据 库 管理 系统 之 中 ， 把 各 和 
; 求 统一 到 一 个 多 媒体 用 户 接口 上 ， 并 将 多 媒体 信息 的 查询 检索 统一 表现 出 来 。 集 中 统 
< 所 型 可 以 实现 建 模 统一 、 管 理 与 操作 方式 统一 、 用 户 
“、》、 搁 口 统一 、 查 询 结果 的 表示 方式 统一 等 诸多 功能 。 在 
.1 所 > 理论 上 ,集中 统 -型 能 够 充分 做 到 对 多 媒体 数据 进行 
14 有 效 的 管理 与 使 用 * 但 实际 上 这 种 多 媒体 数据 库 系统 
-| 实现 的 难度 极 大 。 集 中 统一 型 多 媒体 数据 库 的 系统 结 
1 
1 
1 
1 
1 
















































构 如 图 i4 所 示 。 
下 客户 /服务 器 型 

与 协作 型 相似 , 客户 /服务 器 型 ( 主 从 型 ) 的 组 织 结 
图 6.14 集中 统一 型 多 媒体 数据 库 系统 结构 “ 构 中 的 各 种 不 同 媒体 数据 分 别 有 自 己 的 数据 库 ,但 每 

种 媒体 的 数据 库 将 各 用 一 个 管理 系统 服务 器 来 实现 

管理 与 操纵 ， 同 时 ， 对 所 有 媒体 服务 器 的 综合 和 操纵 又 用 一 个 多 媒体 服务 器 来 完成 。 它 与 
户 的 接口 采用 客户 进程 实现 ， 客 户 与 服务 器 之 间 通过 特定 的 中 间 件 系统 连接 。 这 种 结构 实现 
了 协作 型 可 以 实现 的 功能 ， 同 时 也 提高 了 系统 对 不 同类 型 媒体 信息 的 综合 处 理 的 能 力 。 客 户 / 
服务 器 型 多 媒体 数据 库 的 系统 结构 如 图 6.15 所 示 。 





















































用 户 用 户 用 户 
[用 户 接 ] 。 [者 户 接骨 户 接口 ] 





多 媒体 服务 器 用 中 间 件 





图 6.15 客户 /服务 器 型 多 媒体 数据 库 系统 结构 
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4) 超 媒体 型 

超 媒体 型 结构 强调 对 数据 时 空 索 引 的 组 织 ， 其 目的 是 将 所 有 计算 机 中 的 信息 和 其 他 系统 
中 的 信息 都 连接 在 一 起 ， 而 且 信息 也 要 能 够 通过 超 链接 随意 扩展 和 访问 。 其 优点 在 于 不 必 建 
立 一 个 统一 的 多 媒体 数据 库 系统 ， 而 是 把 数据 库 分 散 到 网 络 上 ， 并 把 整个 网 络 作为 一 个 信息 
空间 ， 只 要 设计 并 使 用 理想 的 访问 工具 就 能 够 访问 和 使 用 这 些 信息 。 


6.5.3 ”多 媒体 数据 库 基 于 内 容 的 检索 


在 数据 库 系 统 中 ， 数 据 检 索 是 一 种 频繁 使 用 的 任务 ， 对 多 媒体 数据 库 来 说 ， 其 检索 任务 
通常 是 基于 媒体 内 容 而 进行 的 。 由 于 多 媒体 数据 库 的 数据 量 大 ， 包 含 大 量 的 如 图 像 、 声 音 、 
视频 等 非 格式 化 数据 ， 对 它们 的 查询 和 检索 比较 复杂 ， 往 往 需要 根据 媒体 中 表达 的 情节 内 容 
进行 检索 。 例 如 ,“ 找 出 具有 声音 注释 的 图 像 ” 或 “ 找 出 所 有 动画 ”等 。 基 于 内 容 的 检索 (CBR) 
就 是 对 多 媒体 信息 检索 使 用 的 一 种 重要 技术 。 

基于 内 容 的 检索 (Content Based Retrieval， CBR) 是 指 根据 媒 ~ 体 对 象 的 内 容 、 语义 及 
上 下 文联 系 进行 检索 。 它 从 媒体 数据 中 提 区 出 特定 的 信息 线索 根据 这 些 线索 在 多 媒体 数 
据 库 的 大 量 媒体 信息 中 进行 查找 ， eR 数据 。 


。 多 毁 体 数据 库 基于 内 容 的 检索 特点 、 和 NA- 


(D 检索 一 般 是 针对 具有 “海量 ”数据 的 数据 库 的 快速 检索 。 

CO) 非 关键 字 检索 检索 方式 。 它 直接 对 图像 、 视 频 、 音 频 进行 分 析 、 抽 取 特 征 ， 并 使 用 这 
些 特征 进行 检索 。 XX 六 本 

(3) 检索 所 使 用 的 特征 十 分 复杂 y 对 不 同 的 媒体 信息 需要 采取 不 同 的 提取 特征 的 方法 ， 如 
对 图 像 特征 的 提取 就 可 以 有 形状 特征 、 颜 色 特 征 、 a 轮廓 特征 等 。 

WU 行 。 了 特征 的 检索 可能 出 现 多 个 检索 结 者 果 ， 往 往 需要 采用 人 机 
交互 的 方式 来 确认 最 终 的 结果 。 x* 
(5) 基于 内 容 的 检索 是 一 种 非 精确 匹配 检索 方法 。 它 需要 借助 模式 识别 进行 语义 分 析 和 特 
征 匹配 ， 只 能 是 近似 性 查询 。 一 般 来 说 ， 在 检索 的 过 程 中 ， 采 用 和 逐步 求 精 的 办 法 ， 每 一 层 的 
中 间 结 果 是 一 个 集合 ， 不 断 减 少 集合 的 范围 ， 最 终 实现 检索 目标 的 定位 ， 这 与 数据 库 检索 的 
精确 匹配 算法 有 明显 的 不 同 。 

(6) 基于 内 容 的 检索 需要 利用 图 像 处 理 、 模 式 识别 、 计 算 机 视觉 、 图 像 理解 等 学 科 中 的 一 
些 方法 作为 部 分 基础 技术 。 

2， 基 于 内 容 的 检索 中 常用 的 媒体 特征 

(D 音频 ; 主要 音频 特征 有 基 音 、 共 振 峰 等 音频 底层 特征 ， 以 及 声 纹 、 关 键 词 等 高 层次 的 

















































































































(2) 静态 图 像 : 主要 包括 颜色 直 广 图、 纹理、 轮廓 等 图 像 的 底层 特征 和 人 脸 部 特征 、 表 情 
特征 、 物 体 (或 零件 ) 和 景物 特征 等 高 层次 特征 。 
(3) 视频 : 视频 包含 的 信息 最 丰富 最 复杂 ， 其 底层 特征 包括 镜头 切换 类 型 、 特 技 效果 、 摄 
像 机 运动 、 物 体 运动 轨迹 、 代 表 帧 、 全 景 图 等 ， 高 层 特征 包括 描述 镜头 内 容 的 事件 等 。 

(4) 文本 : 关键 字 为 文本 对 象 的 内 容 属性 。 
(5) 图 形 : 由 一 定 空间 关系 的 几何 体 构成 。 几 何 体 的 各 种 形状 特征 、 周 长 、 面 积 、 位置、 
几何 体 空间 关系 的 类 型 等 ， 被 称 为 图 形 内 容 属 性 。 
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一 多 若 你 乒 林 及 真 应 用 (第 二 县) 

3 提取 媒体 对 象 内 容 属性 的 方式 

对 于 不 同 的 媒体 信息 提取 其 特征 的 方式 有 所 不 同 ， 大 致 可 以 分 为 手工 方式 、 自 动 方式 和 
混合 方式 等 3 种 类 型 。 

(1) 手工 方式 。 主 要 用 于 对 人 类 敏感 的 媒体 特征 进行 提取 ， 如 文本 检索 中 的 关键 词 特征 、 
图 像 的 纹理 特征 、 边 缘 特 征 、 视 频 镜头 所 含 的 摄像 动作 等 。 手 工 方式 简单 但 是 工作 量 大 ， 提 
取 的 尺度 因 人 而 异 ， 增 加 了 不 确定 性 。 
(2) 自动 提取 方式 。 实 现 由 计算 机 控制 的 对 媒体 信息 内 容 属 性 自动 提取 是 人 们 研究 和 应 
用 的 最 终 目标 ， 如 果 能 够 实现 的 话 将 是 一 种 最 理想 的 特征 提取 方式 。 自 动 提取 过 程 需要 十 分 
复杂 的 媒体 分 析 和 识别 技术 ， 如 图 像 理解 、 视 频 序列 分 析 、 语 音 识别 技术 等 。 因 相关 的 基础 
算法 研究 还 没有 达到 实用 水 平 ， 所 以 目前 自动 提取 方式 远 没有 达到 实用 阶段 。 
(3) 混合 方式 。 它 是 手工 方式 和 自动 提取 方式 的 结合 。 对 于 能 够 通过 自动 提取 方式 得 到 
的 特征 由 计算 机 完成 ， 否 则 就 使 用 手工 方式 。 目 前 的 应 用 系统 中 小 常 采 用 这 种 方式 。 


4， 基 于 内 容 检索 应 用 系统 的 体系 结构 NA 


总 体 上 讲 ， 基于 内 容 的 检 过 系统 可 分 为 数据 生成 系统 和 数据 库 坦 询 子 系统 两 大 部 分 , 
两 大 部 分 之 间 通过 辅助 的 知识 规则 进行 信息 的 交 羡 必 基于 内 容 的 检索 系统 一 般 具 有 图 6.16 所 
示 的 体系 结构 。 oR 











































































































6.16 ”基于 内 容 的 检索 系统 结构 


基于 内 容 的 检索 系统 各 模块 功能 如 下 。 

(1) 目标 标志 (也 称 为 插入 子 系统 ): 目标 标志 为 用 户 提供 了 “锁定 ”目标 的 工具 。 它 以 全 
自动 或 半自动 (需要 用 户 干预 ) 的 方式 标示 出 需要 的 对 象 或 内 容 关 键 点 , 如 对 媒体 进行 分 割 或 节 
段 化 ， 标 示 图 像 、 视 频 镜头 等 媒体 重点 感 兴趣 的 区 域 、 捕 获 视频 序列 中 的 动态 目标 等 ， 以 便 
针对 目标 进行 特征 提取 并 检索 。 

(2) 特征 提取 子 系统 : 对 用 户 或 系统 标明 的 媒体 对 象 进行 特征 提取 处 理 。 特征 提取 子 系统 
提供 两 种 工作 方式 一 一 全 局 性 的 总 体 特征 提取 方式 (如 图 像 的 直方 图 特征 等 ) 和 面向 对 象 的 特 
定 目 标 特征 提取 方式 (如 图 像 中 的 人 物 、 视 频 中 的 运动 对 象 等 ), 在 提取 特征 时 ,往往 需要 知识 
处 理 模块 的 辅助 ， 由 知识 库 提 供 有 关 的 领域 知识 。 

(3) 数据 库 : 生成 的 数据 库 由 媒体 库 、 特 征 库 和 知识 库 组 成 。 媒 体 数据 用 于 存储 输入 的 原 
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始 的 媒体 数据 ， 它 包括 各 种 媒体 数据 ， 如 图 像 、 视 频 、 音 频 、 文 本 等 ， 用 户 输入 的 特征 和 视 
频 处 理 自动 提取 的 内 容 特征 数据 被 存 入 特征 数据 库 ， 知 识 库 中 存放 知识 表达 及 规则 ， 知 识 表 
达 可 以 更 换 ， 以 适用 于 不 同 的 应 用 领域 。 

(4) 查询 子 系统 : 查询 子 系统 以 示例 查询 的 方式 向 用 户 提供 检索 接口。 按 查询 时 的 人 机 交 
互 方式 不 同 ， 可 将 查询 方式 分 为 操纵 交互 输入 方法 、 模 板 选择 输入 方式 、 用 户 提交 特征 样本 
的 输入 方式 3 种 ， 一 个 良好 的 查询 子 系统 应 同时 支持 多 种 方式 的 组 合 。 

(5) 检索 引擎: 检索 是 利用 特征 之 间 的 距离 函数 来 进行 相似 性 检索 。 距离 函数 模仿 了 人 类 
的 认 知 过 程 ， 对 不 同类 型 的 媒体 数据 有 互 不 相同 的 距离 函数 。 检 索引 擎 中 包括 一 个 较为 有 效 
可 靠 的 相似 性 测量 函数 集 。 

(6) 索引 /过 滤器 : 检索 引擎 通过 索引 /过 滤 模 块 达到 快速 搜索 的 目的 。 

5， 检 索 过 程 ,7 

基于 内 容 的 多 媒体 数据 库 的 检索 过 程 是 非 精确 匹配 过 程 , /所 以 它 具有 浙 进 性 ， 多 数 情况 
下 一 次 检索 的 结果 一 般 不 可 能 准确 命中 ， 只 能 逐步 地 逼近 目标 \ 这 就 要 求 用 户 的 参与 检索 的 
过 程 ， 不 断 修正 检索 的 结果 ， 直 到 满意 为 止 。 基 于 多 媒体 数据 库 的 检索 过 程 如 图 6.17 所 示 。 
用 户 查 询 尔 例 与 说 明 


N 
计算 特征 、 相 似 性 此 配 










































































修改 检索 结果 | 





A , 
\ 图 6.17 六 于 内 容 冰 多 失 休 数据 库 梯 过 程 图 示 

相关 模块 说 明 如 下 。 

(1) 用 户 查询 示例 与 说 明 : 用 户 开 始 检索 时 ， 系 统 提供 一 个 检索 的 示例 ,用 户 可 根据 示例 
的 引导 ， 以 系统 可 识别 的 一 个 检索 的 格式 ， 开 始 检索 过 程 。 检 索 的 最 初 条 件 可 以 用 特定 的 查 
询 语言 来 形成 。 

(2) 相似 性 匹配 : 将 特征 与 特征 库 中 的 特征 按照 相应 的 匹配 算法 进行 匹配 运算 。 

(3) 修改 检索 结果 : 也 就 是 要 进行 特征 调整 。 用 户 对 系统 返回 的 一 组 满足 初始 特征 的 检索 
结果 进行 浏览 ， 选 出 满意 的 结果 ,检索 过 程 完成 ; 或 者 从 候选 结果 中 选择 一 个 最 接近 的 示例 
进行 特征 调整 ， 然 后 形成 新 一 轮 的 查询 。 

(4) 重新 检索 : 逐步 缩小 查询 范围 ， 重 新 开始 检索 过 程 。 该 过 程 直到 用 户 放弃 或 得 到 满意 
的 查询 结果 时 为 止 。 

6 基于 内 容 的 检索 举例 一 一 图 像 检索 


1) 基于 颜色 直方 图 的 检索 

颜色 直方 图 是 一 幅 图 像 中 各 种 颜色 (或 灰 度 ) 像 素 点 数量 的 比例 图 。 它 是 一 种 基于 统计 的 
特征 提取 方式 。 通 过 统计 一 幅 图 像 中 的 不 同 的 颜色 ( 灰 度 ) 种 类 和 每 种 颜色 的 像素 数 ， 并 以 直 
方 图 形式 表示 出 来 就 构成 了 图 像 的 颜色 直方 图 。 图 6.18 是 一 幅 静 态 图 像 及 其 颜色 直方 图 。 直 
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一 方 图 








绿色 
所 有 
查询 
图 与 
中 确 
图 像 


可 以 
4 方 
i 检 


山 


比 度 





计 特 


轮廓 。 
库 中 ， 
依 索 结果 。 基 
3) 基于 纹理 


下 方 给 出 





一 系列 的 技术 指标 ， 其 中 色 阶 的 值 表示 某 种 色彩 或 
色 阶 值 的 像素 个 数 。 

















灰 度 值 ， 数 量 表 示 具 有 该 





(1) 使 有 
在 直方 图 的 
图 像 的 颜色 
空间 。 

(2) 使 
数据 库 中 








定 具 有 相似 





基于 轮廓 航 
的 轮廓 线 提 
实现 由 计算 
法 是 采用 图 


2) 基于 轮廓 的 











颜色 


图 6.18 静态 图 像 与 其 颜色 直方 图 
利用 基于 颜色 直方 图 检索 ， 其 示例 可 以 由 如 下 方法 给 出 。 


分 布 都 符合 














是 目前 业界 研究 较 多 
机 自动 提取 其 轮廓 线 ， 











通过 计算 


对 轮廓 进行 检索 的 方法 是 ， 


先 提 
检索 条 件 中 的 轮廓 特征 ; 











等 。 对 纹理 








(1) 统计 法 











性 对 纹理 规 


(2) 结构 法 适 于 排列 规则 对 象 
描述 纹理 的 结构 和 特征 及 特征 与 参数 的 关系 。 
示例 法 。 检 索 时 首先 将 已 有 的 医 


列 规则 
基于 纹理 的 











定 出 特征 及 


色彩 或 明暗 度 的 变化 来 体现 图 像 表面 细节 。 
分 析 方法 主要 有 统计 法 和 结构 法 两 种 。 

于 分 析 细 密 而 规则 的 对 象 ， 
特征 与 参数 之 间 
的 纹理 ， 如 布 纹 医 


帮 图 像 : 将 一 幅 图 像 的 颜色 直 广 图 作为 检索 条 件 时 ， 系 统 用 该 图 
图 像 颜色 直方 图 进行 匹配 全 得 到 检 
6) 使 用 图 人 的 一 页 了 图 : 使 用 从 图 






像 中 分 割 出 来 和 


过 是 用 交通 过 外 图 估 的 大 下 ,从 数据 库 中 检索 出 办 
9 问题 ， 对 于 不 同 部 分 内 容 对 比 明 显 
但 对 平 对 比 不 强烈 的 图 像 ， 自 动 提取 十 分 困难 。 较 好 
| 模 自 动 分 割 的 方法 与 识别 目标 的 前 景 背景 模型 相 结合 ， 从 而 
取 待 检索 图 像 的 轮廓 ， 并 计算 轮廓 特征 ， 


所 要 的 图 像 ， 


9 构成 : 如 检索 “ 约 45% 红 色 ，25% 绿 色 的 图像” 直人 有 了 红 人 有 
例 ， 检 索 系 统 会 将 查询 条 件 转换 为 对 颅 色 半 方 图 的 匹配 模式 。 检 索 结果 
定 的 检索 条 件 ， 尽 管 查 到 的 大 多 数 不 是 


但 缩小 





像 的 颜色 直方 


洁 果 的 图 像 集合 。 
1 从 数据 库 


施 桂 
的 图 


似 的 图 像 。 
像 ， 已 基本 


北 较 精确 的 
保存 在 特征 


得 型 

















与 特征 库 的 轮廓 特征 的 相似 度 来 决定 匹配 程度 ， 并 给 


于 轮廓 特征 的 检索 方式 也 可 以 和 基于 颜色 特征 的 检索 结合 起 来 使 





如 木 纹 、 
关系。 


其 特征 包括 粗糙 性 、 


沙 地 、 草 坪 等 




















案 、 砖 墙 表面 等 。 














检索 往往 采 























户 ， 当 用 户 
步调 整 纹理 





选中 其 中 
特征 ， 

















此 外 , 基于 内 容 的 视频 检索 、 基 于 内 


价值 ， 


吸引 着 众多 本 











究 机 构 和 科学 





像 纹 理 以 缩 略 








个 和 查询 要 求 最 接近 的 纹理 形式 时 ， 
并 逐步 返回 越 来 越 精确 的 结果 。 





容 的 音乐 及 声音 信息 











方向 性 和 对 


并 根据 像素 间 灰 度 的 统 





结构 法 根据 纹理 基 元 及 











形式 全 部 呈现 














系统 以 查询 表 的 形式 让 用 户 








的 检索 也 有 着 较 大 的 研究 意义 和 
[作者 不 断 进行 研究 与 探索 ,并 取得 了 许多 研究 成 果 。 





多 媒体 信息 的 组 织 人 

7 基于 内 容 的 多 媒体 信息 存 取 技 术 的 研究 方向 

基于 内 容 的 多 媒体 信息 存 取 技术 目前 还 面临 着 许多 困难 。 这 方面 未 来 的 研究 方向 主要 集 
中 在 以 下 几 个 方面 。 
(1) 多 特征 综合 检索 技术 : 多 特征 综合 检索 技术 的 目标 是 将 多 媒体 信息 中 包含 的 视觉 、 听 
觉 、 时 间 和 空间 关系 特征 进行 有 机 的 组 织 ， 使 用 户 可 以 使 用 多 种 媒体 特征 进行 查询 ， 并 按照 
户 的 查询 要 求 合并 各 种 特征 的 检索 结果 。 使 用 多 特征 综合 检索 更 容易 提高 检索 命中 率 。 

(2) 高 层 特 征 和 低层 特征 关联 技术 : 人 和 计算 机 对 多 媒体 信息 中 所 包含 内 容 的 理解 是 完全 
不 同 的 ， 如 图 像 中 的 人 物 、 山 灾 、 小 鸟 等 概念 是 人 们 使 用 的 高 层 特征 ， 计 算 机 中 的 这 些 信息 
采用 了 如 直方 图 、 纹 理 等 低层 特征 来 描述 。 如 果 能 够 建立 这 些 底层 的 特征 与 高 层 特征 的 关联 ， 
就 能 够 使 计算 机 自动 抽取 媒体 的 语义 ， 并 实现 基于 内 容 的 快速 检索 。 

(3) 高 维度 索引 技术 : 大 型 媒体 库 的 检索 离 不 开 索引 的 支持 。 尤其 是 多 媒体 数据 的 内 容 特 
征 描述 方法 很 多 ， 如 果 根 据 内 容 特 征 建立 高 维度 的 索引 ， 就 可 以 实现 对 多 媒体 数据 进行 基于 
内 容 的 多 特征 检索 。 但 在 大 型 集成 的 检索 中 ， 多 媒体 特征 达 10? 量 级 ， 大 大 多 于 常规 
数据 库 的 索引 能 力 ， 因 此 ， 需 要 研究 新 的 索引 结构 和 法 | 六 所 检索。 

(4) 流 媒 体内 容 的 结构 化 : 视频 和 音 频 信息 是 典型 的 流 媒体 , 它们 包含 了 大 量 难以 用 低层 
特征 描述 的 高 层 语 Pe 基于 内 容 的 检索 十 分 不 便 。 
如 果 对 时 序 媒 体 信息 进行 结构 化 ， a 接 操 纵 连续 媒体 流 数据 的 内 容 ， 并 实现 基 
于 内 容 的 时 序 媒体 检索 。 

(5) 用 户 查询 接口 : NN SH 如 何 形成 并 提 
交 查 询 等 。 y 
(6) 数据 模型 及 描述 : 统 Re a 
内 容 存 取 的 理论 基础 “多 媒体 信息 内 容 描述 标 ; MPEG-7 目前 还 在 制定 中 。 

(7) 性 能 评价 体系 对 检索 定义 标准 的 性 能 价 体系 ， 以 全 面 检验 检索 算法 的 性 能 。 

(8) 三 维 得 索 ， 三 维 模型 的 应 用 越 来 越 广泛 、 工 业 产品 设计 、 虚 拟 现实 、 虚 拟人 、 
三 维 游戏 、 教 育 人 影视 动画 等 都 广泛 使 用 三 维 模型 。 因此， 目前 有 数 以 兆 计 的 三 维 模型 存在 
而 且 每 天 都 有 大 量 的 三 维 模型 产生 和 传播 ， 存 在 着 对 三 维 模型 进行 分 析 、 匹 配 与 检索 的 迫切 
需求 ， 对 基于 内 容 的 三 维 模型 分 析 、 匹 配 与 检索 技术 进行 研究 已 变 得 非常 重要 。 国外 这 方面 
发 展 较 早 ， 美 国 普林斯顿 大 学 (Princeton University) 已 经 提出 了 一 套 三 维 模型 库 ， 并 根据 该 库 
设计 了 一 套 检索 系统 。 该 基准 三 维 模型 库 已 成 为 目前 研究 的 一 种 标准 ， 被 很 多 机 构 参考 。 德 
康 斯 坦 茨 大 学 (University of Konstanz) 也 提出 了 一 套 通用 的 模型 库 标准 ， 美 国 德 雷 塞 尔 大 学 
(Drexel University) 提 出 了 CAD 的 模型 库 检索 标准 。 目 前 国内 浙江 大 学 、 北 京 大 学 、 清 华 大 学 
等 学 校 也 陆续 展开 了 这 方面 的 研究 。 




























































































































































































6.6 小 结 


多 媒体 数据 的 组 织 与 管理 是 多 媒体 技术 中 的 重要 组 成 部 分 。 本 章 以 如 何 对 多 媒体 数据 进 
行 组 织 与 管理 为 内 容 ， 介 绍 了 多 媒体 数据 的 特点 和 管理 现状 。 其 中 ， 对 面向 对 象 的 数据 库 技 
术 、 超 文本 / 超 媒 体 技术 、 超 文本 标记 语言 HTML、 可 扩展 的 标记 语言 XML 和 多 媒体 数据 库 
技术 进行 了 较为 详细 的 讲述 。 
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__ -一 随 着 多 媒体 数据 库 技术 、 数 据 压 缩 技 术 和 互联 网 的 迅速 发 展 ， 信 息 的 形式 多 种 


觉 信 息 数 据 不仅 包 括 单 幅 的 图 像 数据 还 包括 视频 数据 ， 针 对 视频 数据 的 特点 ， 进 行 
靠 的 检索 也 是 一 个 需要 研究 的 课题 。 将 信息 检索 技术 推 向 实用 化 ， 也 是 信息 技术 发 
目标 。 

本 章 重点 介绍 现 有 成 熟 技术 的 同时 ， 对 目前 仍然 存在 的 技术 问题 进行 了 分 析 。 
握 本 章 内 容 有 利于 对 多 媒体 技术 的 全 面 了 解 。 









































1， 填 空 题 


(1) 多 媒体 数据 区 别 于 传统 文本 数据 的 特点 主要 有 、 — 


C) 多 媒体 数据 管理 的 基本 方式 有 SS 








多 样 ， 视 
高 速 、 可 
展 的 主要 








学 习 和 党 


(3) 面向 对 象 数据 库 系 统 研究 的 主要 内 容 有 XN 、 、 。 








(4) 面向 对 象 数据 库 的 逻辑 设计 阶段 的 主要 任务 是 、 _、 
YN 




















(面向 对 象 数据 库 的 物理 设计 阶段 的 主要 任务 是 、 
(6) 超 文本 是 指 “RN 

(7) 超 媒体 是 指 ,> 
(8) HTML 的 意思 是 二、 ,YX 
(9) 多 媒体 数据 库 是 指 一 ” 。 ,WK 
(10) 超 文本 与 起 如 体系 统 目前 存在 的 主要 问题 有 

(1D 多 媒体 数据 库 的 层次 结构 可 划分 因 2 








(12) 多 媒 库 的 组 织 结构 可 分 为 
(13) 基于 内 容 的 检索 是 指 。 

(14) 超 媒体 与 超 文本 之 间 的 不 同 之 处 在 于 超 文本 主要 是 以 的 形式 表示 
2. 选择 题 


(1) __ 是 Ted Nelson 在 1965 年 用 计算 机 处 理 文本 文件 时 提出 的 一 种 把 文本 中 

关 文本 组 织 在 一 起 的 方法 ， 让 计算 机 能 够 响应 人 的 思维 及 能 够 方便 地 获取 需要 的 信和 

A. 超 文 本 B. 多 媒体 C. 超 媒 体 D. 流 媒 体 

(2) 超 文 本 系统 采用 一 种 _ 组 织 块 状 信息 , 没有 固定 的 顺序 , 也 不 要 求 读者 必 
顺序 来 阅读 。 


















































A. 线性 网 状 结构 B. 层次 结构 
C. 非 线性 网 状 结构 D. 关系 结构 

(3) 在 超 文本 和 超 媒 体 中 不 同 信息 块 之 间 的 链接 是 通过 ”连接 的 。 
A. 节点 B. 字 节 C. 链 D. 字 


(4) 下 列 有 关节 点 的 叙述 ， 正 确 的 是 。 
A. 节点 在 超 文本 中 是 信息 的 基本 单元 


fs 


信息 。 


遇 到 的 相 
息 


局 


须 按 某 个 
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B. 节点 是 信息 块 之 间 连 接 的 桥梁 
C. 节点 在 超 文本 中 必须 经 过 严格 的 定义 
D. 节点 的 内 容 只 能 是 文本 
(5) 。 是 在 所 显示 的 图 像 或 类 似 图 像 的 显示 区 上 指明 的 一 个 敏感 区 域 , 作为 触发 转移 的 
源 点 。 
A. 热 字 B. 热 区 C. 热点 D. 热 元 
(6) HAM 模型 把 超 文本 系统 划分 为 3 个 层次 ，_ 处 于 3 层 模型 的 最 底层 ， 涉 及 所 有 传 
统 的 有 关 信息 存储 的 问题 。 
A. 用 户 接 口 层 ”B. 超 文本 抽象 机 C. 数据 库 层 D. HAM 层 
(7) 是 文本 中 被 指定 具有 特殊 含义 或 需 进一步 解释 的 字 、 词 或 词组 。 
A. 热 字 B. 热 区 C. 热点 D. 热 元 
(8) ee 息 转移 的 链 源 而 引入 
的 概念 。 
A. 热 字 B. 热 区 C. 热 SN ， 热 元 
(9) 在 多 媒体 数据 库 系统 中 , 当 一 个 实体 以 文本 ( We 
TY 对 于 多 媒体 数据 的 查询 应 该 是 基 
于 的 。 
A， 内 容 B. 文本 A C. 图 像 D. 字符 
(0 MDBMS 的 组织 + 主 从 型 、 3 种。 
， 分散 型 1 GC: 协作、 D. 网络 型 
0 库 的 功能 描述 中 不 正确 的 是 _ -3 人 六 
A.， 多 媒体 数据 库 系统 能 表达 和 处 理 各 媒体 的 数据 
B。， 具 有 基于 内 容 的 查询 方法 
C， 具 有 开放 性 ， 提 供应 用 程序 接 蝇 及 依赖 于 外 设 和 格式 的 接口 
D. 对 ' 体 提供 不 同 的 操作 方法 
(12) ”用 于 存放 各 种 媒体 信息 ， 包 含 文本 、 图 形 、 图 像 、 视 频 和 动画 等 各 种 媒体 ， 也 
包含 数据 库 和 文献 ， 用 于 存放 这 些 媒体 信息 的 来 源 、 属 性 和 表现 方法 等 。 
A， 媒体 类 节点 B. 动作 与 操作 节点 ”C. 组 织 型 节点 ”D， 推理 型 节点 
(13) 下 列 关 于 XML 的 叙述 正确 的 是 
A. XML 可 完全 代替 HTML 
B. XML 源 于 HTML， 是 HTML 的 升级 
C. XML 中 将 数据 与 显示 分 开 ， 本 身 不 能 直接 显示 内 容 
D. XML 结构 没有 HTML 灵活 
(14) _ ”把 关系 数据 库 中 的 属性 作为 热源 使 用 。 

































































A. 热 字 B. 热 区 C. 热 属 性 D. 热 元 
3， 判断 题 
(1) 超 文本 是 Ted Nelson 在 20 世纪 60 年 代 年 提出 的 一 种 把 文本 中 遇 到 的 相关 文本 组 织 
在 一 起 的 方法 。 ( ) 
(2) 节点 是 超 文 本 中 信息 的 基本 单元 ， 它 只 能 是 某 一 字符 文本 集合 。 ( ) 
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章 . 肥 .，，. 
- 辣 





店庆 接 术 肥 其 这 用 (第 之 入) 
一 (3) 超 媒体 系统 中 的 链 可 分 为 很 多 种 类 型 ， 除 了 基本 结构 链 以 外 ， 索 引 链 ， 推 理 链 、 执 行 
链 也 是 比较 典型 的 链 型 。 C 











(4) 多 媒体 数据 一 般 有 格式 数据 和 无 格式 数据 两 类 。 图 像 、 声 音 都 是 常用 的 格式 数据 。 
€ 

(5) 超 媒 体 与 超 文 本 之 间 的 不 同 之 处 在 于 超 文 本 主要 是 以 文字 的 形式 表示 信息 。 (  ) 

4. 简 答题 

(1) 多 媒体 数据 和 格式 化 数据 ， 如 数字 、 字 符 相 比 有 什么 特点 ? 

(2) 简 述 常用 的 多 媒体 管理 技术 及 其 特点 。 

(3) 超 文本 与 超 媒 体系 统 有 什么 特点 ? 超 文 本 与 超 媒体 最 根本 的 区 别 是 什么 ? 

(4) 多 媒体 数据 库 和 传统 数据 库 有 什么 不 同 ? gh 

(5) 什么 是 超 文 本 标记 语言 ? 简 述 HTML 的 基本 结 机 
































(6) 什么 是 XML、XSL 和 CSS? 

(07) 简 述 XML 的 主要 特点 、 结 构 与 基本 语法 。 NS 
(8) 简 述 XML 与 HTML 的 主要 区 别 。 7 

(9) 简 述 多 媒体 数据 库 中 基于 MR 点 和 热点 。 


_ x 
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第 7 曾 多 媒体 数据 存储 技术 


教学 提示 


Pe 

> 多 媒体 数据 存储 技术 是 多 媒体 技术 中 的 关键 技术 之 一 。 它 主要 解决 
如 何 保存 多 媒体 内 容 江 随 着 多 媒体 技术 的 发 展 ， 存 储 介质 从 最 早 的 
磁带 、 磁 盘 、CDN DVD 发 展 到 蓝光 光盘 ， 存 储 容量 发 生 了 巨大 的 
变化 ， 而 其 中 的 涤 储 方式 也 随 之 改变 ， 并 融入 了 新 的 压缩 算法 。 

教学 目标 

[| 

六 “通过 本 章 学 习 ， 要 求 掌握 存储 介质 的 变革 过 程 ， 光 盘存 储 技术 的 基 
本 原理 、 技 术 标 准 污 了 解 移 动 存储 设备 、 网 络 存储 和 云 存 储 的 基本 
概念 、 术 语 和 基本 原理 及 多 媒体 数据 存储 的 特点 与 技术 要 求 。 


政史 并 体 找 坟 肥 其 应 用 第 之 服 ) 




















数字 多 媒体 技术 为 我 们 的 生活 带 来 了 图 文 并 茂 、 五 光 十 色 、 声 光 动 影 的 全 新 视听 环境 。 


随 着 生活 质量 的 提高 ， 人 们 对 音 、 视 频 的 质量 要 求 也 逐步 提高 。 从 20 世纪 末 的 VCD 到 现在 
的 蓝光 光盘 ， 画 面 质量 已 经 翻 了 数 倍 ，VCD 时 代 的 画面 分 辩 率 为 388*244， 而 蓝光 光盘 的 分 
辨 率 则 为 1 920*1 080。 对 于 音频 ， 从 最 早 的 双 声 道 的 MP3， 发 展 到 DVD 时 代 的 DTS-DVD， 
以 至 现在 蓝光 光盘 里 的 近似 于 无 损 的 多 音 轨 多 声 道 的 DTS/AC3 音频 ， 容 量 都 大 幅 提高 。 这 些 
画 质 和 音质 的 提高 ， 对 于 存储 技术 和 存储 介质 都 提出 了 新 的 要 求 。 

此 外 ， 随 着 互联 网 的 发 展 ， 多 媒体 内 容 不 再 仅仅 是 个 人 所 私有 的 内 容 ， 更 多 的 用 户 希望 
能 够 分 享 自己 的 音 视频 多 媒体 内 容 ， 希 望 能 够 在 网 络 上 的 发 布展 示 自 己 的 多 媒体 内 容 ， 因 此 
对 于 存储 技术 提出 了 适应 网 络 要 求 的 变革 。 

随 着 数码 照相 机 和 数码 摄像 机 的 普及 ， 人 们 无 论 外 出 旅游 还 是 朋友 聚会 ， 都 会 利用 数码 
OT PT LT 
越 多 ， 如 何 保存 管理 这 些 内 容 也 成 了 一 个 令 人 头痛 的 问题 。 

综 上 所 述 ， 随 着 多 媒体 技术 的 迅速 发 展 ， 音 、 i Ss, 媒体 存储 数量 的 迅 
速 增长 ， 也 给 多 媒体 数据 存储 技术 带 ;来 了 新 的 挑战 本 召 多 媒体 数据 存储 的 基础 介 
质 ， 然 后 是 专业 领域 的 存储 技术 ， 最 后 介绍 时 下 比较 流行 云 存储 方案 。 

NS \™ 
7.1 光盘 存储 技术 
SS 

20 世纪 末 ， 存 储 设备 主要 有 磁 ,本 注 、 软盘 和 光盘 -其 中 磁带 采 / 模拟 信号 保存 ， 磁 
带 上 的 模拟 信号 会 随 着 使 用 次 数 增多 出 现 座 损 衰减 ， 时 间 发 了 ， 磁性 减弱 ， 都 会 造成 存储 
的 信息 不 可 靠 ， 甚 至 丢失 。 四 此 磁带 虽然 是 可 移动 设备 ， 但 是 对 于 个 人 用 户 不 具备 实用 性 。 
而 硬盘 和 软盘 则 由 于 容量 站， -存储 的 数据 内 容 有 限 ， 硬 盘 在 当时 的 容量 不 到 4GB， 而 软盘 则 
只 有 1.44MB， 因此 都 不 适宜 保存 大 晶 数 据 汪 光 允 1 入 就 是 在 这 种 背景 下 普及 的 。 


RL 六 60 全 i 个 


光盘 存储 技术 (CD-ROM、VCD、DVD) 如 今 已 得 到 广泛 的 应 用 ， 这 些 技术 的 发 展 始 于 
20 世纪 70 年 代 。 最 初 ， 荷 兰 Philips 公司 的 研究 人 员 开 始 研究 利用 激光 来 记录 和 重 放 信息 ， 
并 于 1972 年 9 月 向 全 世界 展示 了 光盘 系统 。 从 此 ， 利 用 激光 来 记录 信息 的 革命 便 拉 开 了 序 
幕 。 它 的 诞生 对 人 类 文明 进步 产生 了 深刻 的 影响 和 巨大 的 贡献 
从 1978 年 ， 研 究 人 员 把 声音 信号 变 成 用 “1” 和 “0” 表 示 的 二 进 制 数字 ， 然 后 记录 到 以 
塑料 为 基 片 的 金属 圆 盘 上 。Philips 公司 和 Sony 公司 于 1982 年 把 这 种 记录 着 数字 声音 的 盘 推 
向 了 市 场 。 采 用 CD 来 命名 ， 并 为 这 种 盘 制 定 了 标准 ， 这 就 是 世界 闻名 的 “红皮书 (Red Book)”。 
这 种 盘 又 称 为 激光 唱 盘 即 CD-DA。 
由 于 CD-DA 能 够 记录 数字 信息 ， 所 以 便 想 把 它 用 作 计 算 机 的 存储 设备 。 但 从 CD-DA 过 
渡 到 CD-ROM 有 两 个 重要 问题 需要 解决 。 
(1) 计算 机 如 何 寻找 盘 上 的 数据 , 即 如 何 划 分 盘 上 的 地 址 问题 。 因为 记录 歌曲 时 是 按 一 首 
歌 为 单位 的 ,一 片 盘 也 就 记录 20 首 左 右 的 歌曲 ， 平 均 每 首 歌 占用 30MB 以 上 的 空间 。 而 用 来 
存储 计算 机 数据 时 ， 许 多 文件 不 一 定 都 需要 那么 大 的 存储 空间 ， 因 此 需要 在 CD 光盘 上 写 入 
很 多 的 地 址 编号 。 

(2) 把 CD 盘 作 为 计算 机 的 存储 器 使 用 时 ， 要 求 它 的 错误 率 (10 3) 远 远 小 于 声音 数据 的 错 
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| 
误 率 (109)， 而 用 当时 现成 的 CD-DA 技术 不 能 满足 这 一 要 求 ， 因 此 还 要 采用 错误 校正 技术 于 是 
就 产生 了 “黄皮书 (Yellow Book)”。 可 是 ， 这 个 重要 标准 只 解决 了 硬件 生产 厂家 的 制造 标准 问 
题 ( 即 存放 计算 机 数据 的 物理 格式 问题 )， 而 没有 涉及 逻辑 格式 问题 ( 即 计算 机 文件 如 何 存放 在 
CD-ROM 上 , 文件 如 何在 不 同 的 系统 之 间 进 行 交换 等 问题 )。 为 此 ， 又 制定 了 一 个 文件 交换 标 
准 ， 后 来 ISO 把 它 命名 为 ISO 9660 标准 。 经 过 科技 人 员 及 各 行 各 业 人 员 的 共同 努力 ， 大 约 于 
1985 年 将 CD-ROM 推 向 了 市 场 ， 从 此 CD-ROM 走向 实用 化 阶段 。 

自从 激光 唱 盘 上 市 以 来 , 研发 了 一 系列 的 CD 产品 , 主要 有 CD-DA( 存 放 数字 化 的 音乐 节 
目 )、CD-ROM( 存 放 数 字 化 的 文 、 图 、 声 、 像 等 )、Video CD( 存 放 数字 化 的 电影 、 电 视 等 节目 )、 
DVD( 存 放 数字 化 的 电影 、 电 视 、 动 画 等 节目 )， 而 且 还 在 不 断 地 开发 新 的 产品 。 值 得 指出 的 
是 ，CD 原来 是 指 激光 唱 盘 ， 用 于 存放 数字 化 的 音乐 节目 ， 而 今 通 常 把 所 有 的 CD 系列 产品 通 
称 为 CD。 为 存放 不 同类 型 的 数据 ， 制 定 了 许多 不 同 的 标准 ， 见 表 7-1。 


表 7-1 主要 的 CD 产品 标准 |、 




































































































标 ) 
Red Book 
( 红 皮 
Yellow Book 
( 黄 皮 
Green Book 存储 文 、 图 、 声 并 
( 绿 皮 书 ) 多 媒体 节目 》. 


显示 的 图 像 








动画 、 静 态 图 像 、 
动态 图 像 


动画 、 静 态 图 像 






















White Book 数字 影视 
(白皮书 ) p (MPEG-1) 质 量 
5~Ginin( 电 视 ) 模拟 电视 图 像 


| 20min( 声 音 ) 数字 声音 
静态 图 像 


200min 模拟 电视 图 像 














CD 盘 片 结构 如 图 7.1 所 示 。 它 主要 由 保护 层 、 铝 反射 层 、 刻 槽 和 聚 碳 脂 衬 垫 组 成 。 通 常 
人 们 将 激光 唱 盘 、CD-ROM、 数 字 激 光 视 盘 等 统称 为 CD 盘 。CD 盘 上 有 一 层 铝 反射 层 ， 看 起 











来 是 银白 色 的， 故人 们 称 它 为 “ 银 盘 ”。 另 有 一 种 盘 为 CD-R(CD-Record able) 盘 ， 它 的 反射 层 
是 金色 的 ， 所 以 又 把 这 种 盘 称 为 “ 金 盘 ”。 











ce 保护 层 
( (ES 错 反 射 岩 
六 = 
J — 刻 村 
时 原 甬 遍 宰 从 


图 7.1 CD 盘 片 的 结构 
激光 唱 盘 分 3 个 区 : 导入 区 、 导 出 区 和 声音 数据 记录 区 ， 如 图 7.2 所 示 。CD 盘 记录 信息 
区 域 称 为 光 道 。CD 盘 光 道 的 结构 与 磁盘 磁道 的 结构 不 同 ， 磁 盘存 数据 的 磁道 是 同心 环 ， 光 
的 光 道 不 是 同心 环 光 道 ， 而 是 螺旋 型 光 道 。 采 用 这 样 结构 的 原因 主要 是 提高 信息 的 存储 率 。 
为 若 采用 类 似 于 磁盘 的 同心 环 结构 ， 虽 然 磁盘 片 转动 的 角速度 是 恒定 的 ， 但 在 一 条 磁道 和 
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ea. 
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区 并 体 技术 发 其 应 用 (第 之 腑 ) 





一 男 一 条 磁道 上 , 磁头 相对 于 磁道 的 速度 ( 称 为 线 速度) 却 是 不 同 的 。 采用 同心 环 磁道 的 好 处 之 一 























是 控制 简单 ,便于 随机 存 取 , 但 由 于 内 外 磁道 的 记录 密度 (每 英寸 比特 数 ) 不 同 ， 外 磁道 的 记录 
密度 低 ， 内 磁道 的 记录 密度 高 ， 外 磁道 的 存储 空间 就 没有 得 到 充分 利用 ， 因 而 存储 器 没有 达 
到 应 有 的 存储 容量 。CD 盘 转 动 的 角速度 在 光盘 的 内 外 区 是 不 同 的 ， 而 它 的 线 速度 是 恒定 的 ， 
就 是 光盘 的 光学 读 出 头 相 对 于 盘 片 运动 的 线 速度 是 恒定 的 ， 由 于 采用 了 恒定 线 速 度 ， 所 以 内 
外 光 道 的 记录 密度 可 以 做 到 一 样 ， 这 样 盘 片 就 得 到 充分 利用 ， 可 以 达到 它 应 有 的 数据 存储 容 
量 ， 但 随机 存储 特性 变 得 较 差 ， 控 制 也 比较 复杂 。 


























7.1.2 ”光盘 读 、 写 、 擦 原理 A I 


目前 ， 按 读 写 能 力 可 将 商品 化 J F 几 类 。 

(1) 只 读 光 失 (Read Only er. 例如 CD 浪 OM， 光 抢 内 容 在 工厂 里 制作 ， 
户 只 能 读 ， 用 于 电子 出 版 物 、 、 漂 材 库 、 大 型 软件 的 cdo 

(2) 一 次 写 光 盘 (Writ Once Read Many， 了 这 只 能 写 入 一 次 数据 ， 然 后 任意 多 次 读 
取 数 据 ， 主要 用 于 档案 存储 。 交 

(3) 可 探 写 光 盘 (Eiasable 或 Rewritable» 全 CD-RW 就 属于 这 类 光盘 。 它 像 硬盘 一 
样 ， 可 多 次 写 入 和 读 出 ， 主 要 应 用 于 开发 系统 及 大 型 信息 系统 中 。 

下 面 将 介绍 这 3 类 光盘 的 工作 原理 。 

1. 只 读 光盘 的 读 原理 

常见 的 只 读 光盘 有 CD-ROM、CD-DA、 激 光 视 盘 (LD) 等 。 光 盘 上 的 信息 是 沿 着 盘面 螺旋 
形状 的 信息 轨道 以 一 系列 凹 坑 点 线 的 形式 存储 的 。 激 光束 能 在 1hs 内 从 1hm2 探测 面积 上 获得 
满意 的 信 噪 比 (S/N)。 利 用 激光 聚焦 成 亚 微米 级 激光 束 对 轨道 上 模压 形成 的 四 坑 进 行 扫描 ， 如 
图 7.3 所 示 。 光 束 扫描 凹 坑 边 缘 时 ， 反 射 率 发 生变 化 ， 表 示 二 进 制 数字 “1?”， 在 坑内 或 岸上 
均 为 二 进 制 “0” 数 字 。 通 过 光学 探测 器 产生 光电 检测 信号 ， 从 而 读 出 数据 0、1 
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图 7.3 ”只 读 光盘 压 模 的 读 出 信息 表示 
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光 轨 道 的 间距 为 1.6hm， 它 是 由 光束 直径 、 盘 片 转 轴 系 统 偏心 、 盘 片 倾斜 和 厚度 等 因素 决 
定 的 。 坑 宽 不 足 光 道 间距 的 /3， 为 0.4 一 0.5hm。 为 了 提高 读 出 数据 的 可 靠 性 ， 减 少 误 读 率 ， 
存储 数据 采用 8 一 14 调制 (Eight to Fourteen Modulate on，EFM) 编 码 ， 即 1 字 节 的 8bit 数据 位 
经 编码 为 14bit 的 光 轨 道 位 。 这 些 光 轨道 位 采用 RLL(2，10) 规 则 的 插入 编码 ， 即 “1” 码 间 至 
少 有 两 个 “0” 码 ， 但 最 多 有 10 个 “0” 码 。 

2. 可 擦 写 光盘 的 擦 写 原理 

光盘 写 过 程 与 光盘 探 过 程 是 一 个 逆 过 程 ， 写 即 改变 光 介 质 的 性 质 ， 擦 即 恢复 光 介质 原来 
的 性 质 。 读 光束 的 能 量 可 以 较 小 ,功率 只 需 1 一 2mW, 但 是 探 写 光 束 的 功率 一 般 需 要 8 一 20mW。 
对 于 1lhm 直径 的 激光 束 , 功率 如 果 具 有 15mW 的 写 , 那么 其 平均 能 量 密度 达到 2X 10!0W/m2。 
如 此 高 密度 的 能 量 可 以 很 快 改 变 或 破坏 盘面 介质 的 性 质 ， 激 光束 在 光盘 介质 上 形成 烧 孔 、 起 
泡 、 相 变 、 色 变 或 偏振 态 变 化 的 信息 点 ， 这 个 过 程 为 写 过 程 。 起 泡 是 一 次 写 光 
盘 的 工作 原理 。 相 变 、 色 变 和 偏振 态 变化 用 于 可 擦 “ a 面 主要 介绍 常用 的 利用 
相 变 进行 擦 写 操作 的 原理 。 

可 控 写 相 变 光盘 利 上 记录 介质 的 丙 个 和 态 之 名 的 对 和 3 构 的 变 化 来 实现 信 息 记录 和 擦 
除 。 两 种 隐 态 是 反射 率 高 9 晶 态 和 反射 率 低 的 非 蝇 态 (玻璃 态 )。 写 过 程 是 把 记录 介质 的 信息 点 

晶 态 转变 到 非 晶 态 。 控 过 程 是 写 的 过 过程 把 激光 来 照射 的 信息 点 从 非 晶 态 恢复 到 晶 态 。 
写 过 程 要 克服 较 高 的 能 量 势 又 ， 写 3 
相 实 玉江 是 一 种 “全 光 ” 





















































































、 、 上 大 存储 没 有 联系 :目前 商 化 的 相 变 光 竹 是 一 种 直 
j3 在 原 记录 介质 上 ， 利 用 探 写 操作 重 写 数据 0、1 
色 变 光 盘 的 擦 所 写 原 理 与 相 变 光盘 类 似 ， 在 此 不 再 效 述 ， 
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光盘 驱动 的 机 械 装置 和 软驱 很 类 似 ， 共有 有 3 个 电动 机 ， 分 别 控 制 不 同 的 功能 ， 一 个 用 来 
旋转 光盘 盘 片 ; 全 个 驱动 激光 头 读 取 资 料 的 电动 机 ， 还 有 一 个 是 :控制 光盘 盘 片 的 插入 和 退出 
的 电动 机 。 一 个 传统 的 光驱 设备 如 图 7.4 所 示 。 

无 论 是 读 出 还 是 写 入 过 程 ， 都 是 靠 光盘 高 速 旋转 来 完成 一 、 
激光 束 对 光盘 盘面 的 扫描 。 由 于 物理 机 械 装 置 的 差异 ， 需 要 


本 re 
引入 几 个 参数 来 描述 一 个 光驱 的 技术 性 能 。 
(1) 平均 寻 道 时 间 (average access time)， 平 均 寻 道 时 间 是 
指 激光 头 从 当前 位 置 移 到 新 位 置 并 开始 读 取 数据 所 花费 的 平 


均 时 间 。 平 均 寻 道 时 间 越 短 ， 光 驱 的 性 能 越 好 。 
(2) 数据 传输 率 (data transfer rate)， 也 就 是 大 家 常 说 的 光 
驱 倍 速 ， 它 是 衡量 光驱 性 能 的 最 基本 指标 。 单 倍速 光驱 是 指 每 秒 从 光驱 存 取 150KB 数据 的 光 
驱 。 目 前 来 说 ， 普 通 的 DVD 光驱 的 速率 都 是 24 或 者 32 倍速 ， 也 就 是 每 秒 能 够 读 取 3 600KB 
或 者 4 800KB 的 数据 。 
(3) CPU 占用 时 间 (cpu loading), CPU 占用 时 间 是 指 光驱 在 维持 一 定 的 转速 和 数据 传输 率 时 所 
占用 CPU 的 时 间 。 它 也 是 衡量 光驱 性 能 的 一 个 重要 指标 。CPU 占用 时 间 越 少 ， 其 整体 性 能 越 好 。 
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(4) 数据 缓冲 区 (buffer)， 数 据 缓冲 区 是 光驱 内 部 的 存储 

据 传输 率 。 目 前 流行 的 大 多 数 光驱 的 缓冲 区 为 128KB 或 者 2 
光驱 的 正面 一 般 包 含 以 下 部 件 : 防 尘 门 、 光 盘 托 盘 、 耳 机 

选 )、 弹 出 键 、 读 盘 指 示 灯 、 手 动 退 盘 孔 。 
这 里 以 可 擦 写 型 光盘 驱动 器 为 例 来 说 

栓 驱 动 器 的 结构 框图 。 光 盘 驱 动 器 主要 FE 

电动 机 伺服 和 微 处 理 器 等 部 分 组 成 。 


























明光 盘 驱 动 器 的 ] 
光学 头 、 
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sk ， 控 制 光盘 以 恒 线 
微 处 理 器 执行 上 述 功能 的 时 序 和 控制 操作 ， 





























控 写 数据 和 读 出 数据 时 要 调节 
取信 与 下 中 何 服 系统 根据 闪电 检测 的 该 写 交点 
光学 头 的 二 维 力矩 器 ， el 
方向 上 移动 透镜 ， 实现 跟 中 何 服 ， 全 物 久 开 信 光 
(跟踪 )。 、 
nl 
以 按照 标准 的 格式 读 写 数据 。 
机 传递 数据 。 
光盘 驱动 器 与 光盘 片 的 者 合 部 件 是 光学 头 系统 ， 其 作用 是 从 光盘 片 读 
写 入 新 的 数据 。 除 了 可 发 射 微细 激光 束 的 半导体 激光 器 外 ， 光 学 头 中 包 
束 准确 地 照射 到 光盘 的 信息 轨迹 上 ， 另 外 光学 头 中 还 包含 光电 接收 系统 ， 
电信 号 输出 。 
光 存 储 技术 是 利 有 
照射 存储 介质 ， 导 致 介质 的 某 些 性 质 发 生变 化 而 将 信息 保存 
介质 ， 识 别 出 介 质 中 存储 单元 性 质 的 变化 ， 将 这 种 变化 转换 为 数字 
常 都 是 以 二 进 制 数据 








息 
息 。 








[ 作 原 理 。 图 7. 
读 写 擦 通道 、 聚 焦 伺 服 、 


与 数据 信息 轨道 的 跟踪 
迹 伪 ， 实现 聚焦 个 服 ， 
落 在 光盘 面 上 (聚焦 ) 的 信息 轨道 中 央 


存储 介质 在 激光 照射 下 某 些 性 质 会 发 生变 化 的 原理 。 写 入 信息 
F 来 : 读 取 信息 


插 孔 、 音 量 控制 按钮 、 播 放 键 (可 


5 所 示 为 读 写 型 光 
跟踪 伺服 、 主 轴 


误差 信 
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号 ， 由 放置 
光盘 的 半径 






速 或 恒 角 速 旋转 ， 
并 通过 接口 与 计算 





出 数据 和 向 光盘 片 


含 光 学 系统 ， 使 激光 


把 反射 光 信号 变 成 


时 激光 
\ 时 通过 激光 扫描 
通 


b 


在 实际 操作 中 ， 





式 存储 信息 的 ， 所 以 首先 要 将 信息 转化 为 二 进 制 数据 。 写 入 时 ， 将 主 


机 送 来 的 数据 编码 送 入 光 调制 器 ,这样 激光 源 就 输出 强度 不 同 的 光束 。 此 激光 束 经 光路 系统 、 


物镜 聚焦 后 照射 到 介质 上 ， 其 中 一 种 存储 方法 是 介质 被 激光 烧 蚀 出 小 止 坑 。 


介质 上 是 否 有 小 








凹 坑 的 两 种 状态 对 应 着 两 种 不 同 的 二 进 制 数 据 0 或 者 1。 识 别 存储 单元 是 否 有 
读 出 被 存储 的 数据 ， 光 盘 驱 动 器 的 工作 原理 如 图 7.6 所 示 。 








fs 


小 四 坑 ， 即 可 
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,六 二 
图 7.6 光盘 驱动 器 的 工作 原理 
NN 
7.1.4 CD 光盘 . 2 


At 上、 

随 着 音 视 频 技术 的 发 展 ， 对 于 : 稚 短 侍 罕 量 也 有 了 新 的 要 求 ， 以 至 于 现在 的 高 清 电影 ， 
需要 存储 高 达 46GB 的 容量 ， 因 此 同样 是 光盘 ， 研 发 了 新 的 技术 ， 出 现 了 不 同 的 标准 。 

下 面 介绍 业界 应 用 的 光 械 存储 格式 。 

1. CD 简介 一 Ne 人 

CD 是 用 来 存储 数字 信息 的 光盘 。 最 初 定 日 沫 存储 录音 数据 的 ， 后 来 引用 来 作为 数据 存 
储 用 CaoS 视频 存储 (CD-R), “可 擦 写 存 储 (CD-RW)， 视 频 光盘 (VCD)， 超 级 视 
频 光 盘 (SVCD) 及 照片 CD、 扩 展 CD 等 。 音乐 CD 和 音乐 CD 播放 器 从 1982 年 开始 进入 商用 
阶段 。 

CD 是 激光 唱 盘 技术 的 发 展 。 Sony 公司 在 1976 年 首次 公开 演示 光学 数字 音乐 光盘 ,1978 年 ， 
Sony 公司 又 演示 了 一 个 含有 150min 长 度 、 采 样 率 为 44 056Hz 的 音乐 光盘 , 该 技术 细节 在 1979 
年 在 布鲁塞尔 举办 的 AES 大 会 上 公开 。 同年 3 月 , Philips 公司 发 布 了 一 份 光 学 音乐 盘 片 原型 。 
这 两 家 公司 在 1979 年 宣布 合作 研发 数字 音乐 盘 片 , 经 过 一 年 的 努力 , 他 们 发 布 了 一 份 红皮书 ， 
也 就 是 CD 标准 。 

标准 的 CD 有 两 种 尺寸 ， 通 用 的 是 120mm(4.7in) 直 径 ， 容 纳 74 或 者 80min 的 音乐 长 度 ， 
或 者 650 一 700MB 数据 容量 。 另 外 一 种 是 80mm 直径 的 微型 CD， 它 可 以 容纳 24min 音乐 或 
者 210MB 数据 ， 但 是 没有 能 够 普及 。 目 前 大 多 数 是 用 的 还 是 120mm 直径 的 CD。 

2. Audio CD 


Audio CD( 另 一 种 说 法 是 CD-DA) 是 Sony 公司 和 Philips 公司 在 1980 年 发 布 的 红皮书 中 规 
定 的 。 它 的 格式 为 16 位 PCM 编码 的 44.1kHz 采样 率 的 双 声 道 音乐 CD。 

1) 44.1kHz 采样 率 

采样 率 的 确定 是 根据 声音 频率 来 确定 的 ， 一 般 人 耳 能 够 感受 20Hz 一 20kHz， 因 此 CD 里 
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一 面 需 要 记录 并 重 现 的 就 是 这 一 区 段 ， 从 而 确定 了 44.1kHz 的 采样 率 。 


2) 存储 容量 和 播放 时 间 
最 初 ，Philips 公司 和 Sony 公司 的 目标 是 制造 一 个 直径 为 100mm 的 60min 的 CD。 时 任 
Sony 公司 副 总 裁 的 Norio Ohga 建议 扩展 以 容纳 Wilhelm Furtwangler 在 1951 年 指挥 的 最 长 
74min 的 贝多 芬 第 九 交 响 曲 。 多 出 的 14min, 需要 更 大 直径 的 CD, 因此 , 尺寸 由 原来 的 100mm 
延长 到 120mm。 
最 新 的 制作 工艺 允许 CD 容量 增 至 80min， 或 者 数据 容量 增 至 730MB。 但 不 是 所 有 播放 
器 或 者 CD 机 都 支持 。 

3) 数据 结构 

CD 中 最 小 的 单元 实体 是 帧 (Frame)， 一 帧 包含 了 33 字 节 (6 个 完整 的 16 位 双 声 道 样 本 ， 
加 上 9 个 字 节 的 CIRC 错误 校 验 码 )。98 帧 合 在 一 起 称 为 肩 区 (Sector)， 其 中 有 98*24 一 2 352 个 
音乐 字 节 。 播 放 时 以 每 秒 75 个 肩 区 的 速度 播放 ， 即 每 秒 176 400 窗 东 ， 分 成 两 个 声 道 ， 一 个 
样本 两 个 字 节 ， 结 果 就 是 每 秒 44 100 样本 。 

对 于 CD-ROM 数据 光盘 ， 物 理 帧 和 扇 区 的 尺寸 和 CD 和 误 校 验 码 不 能 用 
于 非 音 乐 数据 ， 因 此 引入 了 第 三 层 ， 每 个 扇 区 中 的 2 352 个 字 节 减 为 2 een 
剩余 的 作为 数据 校 验 ， 这 种 方式 是 Mode-1 CD- ROM 阁 式 对 于 视频 CD， 为 了 增加 数据 率 ， 
进入 了 Mode-2 CD-ROM 格式 ， 其 中 去 掉 了 第 三 层 六 数据 量 从 2 048 字 节 增 加 到 2 336 字 节 ， 
剩余 的 16 字 节 用 于 同步 和 头 部 数据 。 < 和 > 

CD ee 二 个 CD 可 以 容纳 最 多 99 个 轨道 。 每 个 轨道 可 以 
有 最 多 100 个 索引 。 站 

4) CD-Text 本 XX 

CD-Text 是 对 红皮书 的 扩 “ 展 : Co 息 ， 如 专辑 名 称 、 歌 曲名 称 、 
术 家 。 这 些 从 存储 于 CD 的 开始 区 域 (大 约 有 5KB 空间 )， 或 者 存储 于 声 道 0 
有 31MB)。 这 些 些 文本 信息 按照 交互 式 文本 传输 系统 (Interactive Text Transmission System, ITTS) 
格式 进行 存储 也 用 于 数字 音乐 广播 或 者 微型 CD。CD-Text 是 由 Sony 公司 在 1996 年 9 月 
发 布 的。 虽然 对 CD-Text 的 支持 比较 普遍 ， 但 不 是 所 有 的 都 支持 。 

有 工具 软件 可 以 单独 抓 取 CD-Text 数据 并 插入 到 CDDB 和 freedb 数据 库 中 。 

5) CD+G 

CD 十 G(CD 十 Graphics) 是 CD 标准 的 一 种 扩展 ， 它 除了 包含 原 有 的 音乐 信息 外 ， 还 包含 了 
低 分 辩 率 的 图 像 。CD 十 G 光盘 经 常用 于 卡拉 OK 机 器 , 它 实现 了 显示 包含 在 光盘 中 的 歌词 信息 。 

除了 卡拉 OK， 其 余 支持 CD 十 G 的 设备 有 NEC Turbo Grafx-CD 和 Turbo Duo、Philips 
的 CD-i、Sega Satum、Mega-CD、JVC 的 X” Eye 等。 部 分 CD-ROM 驱动 器 也 支持 该 格式 。 
从 2003 年 起 ， 大 部 分 DVD 播放 机 已 经 支持 CD 十 G 格式 。 

6) CD 十 Extended Graphics 

CD 十 Extended Graphics(CD 十 XG)， 是 对 CD 十 G 的 加 强 版 本 ， 类 似 于 CD 十 G，CD 十 XG 
使 用 了 CD-ROM 的 基本 功能 来 显示 文本 和 视频 信息 。 这 些 额 外 的 数据 保存 在 子 声 道 R-W, 尽 
管 少 用 ， 但 是 CD 十 XG 光盘 还 是 发 行 过 
7) Super Audio CD 
Super Audio CD 是 1999 年 Sony 公司 和 Philips 公司 研发 的 格式 ， 它 能 够 提供 比 红 皮 书 定 
义 的 更 高 质量 的 音乐 还 原 度 的 只 读 光学 音乐 光盘 。SACD 曾经 陷入 了 和 DVD Audio 的 格式 党 
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争 ， 但 是 双方 都 没有 取代 Audio CD。 

8) CD-MIDI 

CD-MIDI 用 来 保存 音乐 播放 的 数据 , 可 以 在 电子 乐器 上 按照 记录 的 数据 进行 演奏 。 因此 ， 
光盘 中 记录 的 不 是 音乐 。 

3. CD-ROM 


在 CD 发 布 前 ，CD 一 直 作 为 音乐 记录 的 媒体 。 直 到 1985 年 Sony 公司 和 Philips 公司 发 
布 了 CD-ROM 标准 的 黄皮书 , 其 中 定义 了 基于 音乐 CD 物理 格式 的 保存 不 会 变更 的 计算 机 数 
据 存储 的 介质 方式 。 

CD-ROM 广泛 用 来 分 发 计算 机 软件 ， 包 括 视频 游戏 和 多 媒体 应 用 程序 。 

1) 标准 

ISO 9660 定义 了 CD-ROM 上 标准 的 文件 系统 ,UDF 则 扩展 了 ISO 13346 来 支持 只 读 或 可 
控 写 的 DVD。 人 允许 光盘 启动 的 描述 文件 为 EI Torito， 它 允许 光盘 模拟 硬盘 或 者 软盘 来 引导 计 
算 机 。 \ 

不 同 于 音乐 CD， 对 于 数据 CD， 错 误 校 验 不 能 简单 的 依赖 于 每 个 帧 中 的 6 个 字 节 ， 需 要 
提供 额外 的 校 验方 式 。 因 此 出 现 了 前 述 中 提 及 的 Model 和 Mode2 两 种 方式 ， 有 具体 细节 见 
表 7-2。 1 


















































表 7-27 主要 的 CD 产品 标准 
+ 2 352 bytéblock 一 
2 352 数字 音乐 


CD-ROM (mode D) 4 错误 检测 276 校 验 数 据 
CD-ROM (mode 2) 2 336 数据 
2) CD-ROM 容 量 ” 
不 同 的 标准 外 不 同 的 设计 造成 了 集中 不 同 容量 的 CD-ROM， 常 见 的 几 种 不 同 的 CD 产品 
容量 见 表 7-3。 








表 7-3 几 种 不 同 的 CD 产品 


























类 型 扇 区 数 音乐 数据 量 时 长 
(MB) (MiB) (MB) (min) 
8cm 94 500 193.536 184.570 222.264 21 
283 500 580.608 553:711 666.792 63 
650MB 333 000 650.391 650.391 783.216 74 
700MB 360 000 737.280 703.125 846.720 88 
800MB 405 000 829.440 791.016 952.560 90 
900MB 445 500 912.385 870.117 1047.816 99 











3) CD-ROM 传输 速率 
若 CD-ROM 和 Audio CD 的 读 取 速 率 是 一 致 的 , 则 每 秒 传输 数据 150KB, 该 速率 定 为 “1X”， 
即 一 倍速 。 通 过 提高 光盘 转速 ， 可 以 提高 数据 传输 率 。 随 着 技术 的 发 展 ， 目 前 常见 的 传输 速 
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“ 率 一 般 都 达到 48X 或 者 52X， 表 7-4 列 出 了 常见 CD-ROM 的 读 取 速 率 与 转速 。 
表 7-4 几 种 CD-ROM 的 读 取 速率 与 转速 








RPM 





KB/s 



























1x 200 一 500 1 200 一 3 000 4000 
4X | 600 800 一 2 000 1 920 一 4 000 | 4800 
8X 2 1 .600 一 4 000 2 880~7 200 9 600 





3 120~7 800 





2 400~6 000 


注意 : CD-ROM 的 一 倍速 传输 速率 不 同 于 DVD 的 传输 速率 。 DVD 的 一 倍速 为 1.32MiB/s。 


4. VCD 


VCD(Video CD) 用 于 存储 数字 格式 的 视频 媒体 。VCD 可 以 在 专 用 的 VCD 播放 设备 、 
行 的 DVD-Video 播放 器 及 个 人 计算 机 上 播放 。 

VCD 标准 是 在 1993 年 ， 由 Sony、Philips、Matsushita RVe 联合 发 布 的 ， 称 为 白皮书 。 
VCD 的 画 质 比 VHS 视频 要 差 一 些 ， 但 是 噪点 比 VHS 要 少 二 

VCD 的 画面 尺寸 只有 352X240 大 小 ， 长 宽 是 NTSC 视频 尺寸 的 一 半 。 画 面 大 小 大 约 只 
有 PAL 制式 视频 的 1/4。 

Super Video CD 

Super Video CD 是 VCD 的 后 续 发 展 必 也 是 DVD-Video 的 另外 一 种 选择 ， 其 尺寸 是 DVD 
的 23， 是 VCD 的 2.7 倍 ， 能 够 容纳 60min 的 标准 质量 的 视频 。 


5. Photo CD 4 

Photo CD 是 由 Kodak 公司 在 1992 年 发 布 的 用 于 存储 数码 照片 的 CD。 一 张 CD 上 可 以 容 
纳 100 张 高 质量 的 图 片 一 | 

6. CD-i 

Philips 的 绿 皮 书 定义 了 专 为 交互 式 多 媒体 光盘 , 用 于 CD-i 播放 器 。 这 种 格式 的 不 同 之 处 
在 于 它 隐藏 了 一 条 包含 软件 和 数据 的 轨道 ， 这 些 轨 道 只 能 被 CD-i 播放 器 识别 ， 普 通 的 CD 播 
放 器 会 忽略 掉 该 轨道 。 

7. CD-R、 CD-RW 

可 写 的 CD， 是 一 种 空白 CD， 初 始 没有 任何 内 容 ， 人 允许 用 户 使 用 刻录 机 在 上 面 刻录 自己 


的 数据 或 者 音乐 。 但 是 只 能 刻录 一 次 ， 刻 录 一 次 后 不 能 重新 刻录 内 容 。 
CD-RW 人 允许 用 户 多 次 刻录 覆盖 内 容 。 



























































7.1.5 _ DVD 光盘 

















DVD 是 数字 多 用 途 光碟 (Digital Versatile Disc) 的 缩写 。 初 推出 时 , 是 数字 视频 光盘 (Digital 
Video Disc) 的 缩写 ， 当 时 大 多 数 厂 商 只 针对 影像 方面 的 宣传 及 推出 产品 ， 加 之 当时 计算 机 产 
业 对 于 高 容量 的 存储 没有 太 大 需求 ， 后 于 1995 年 规格 正式 确立 时 ， 重新 定义 为 数字 多 用 途 光 碟 。 
在 DVD 诞生 之 前 ，VCD 是 主要 的 视频 发 布 介质 ， 同 时 ， 两 种 光学 存储 格式 也 在 研究 之 
中 ,一 种 是 多 媒体 光盘 (Multimedia Compact Disc, MMCD)， 由 Philips 公司 和 Sony 公司 主导 ， 
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另外 一 种 是 高 密度 光 
Hitachi, MitsubishiE 


1. DVD 的 标志 





| 


得 (Super Density，SD)， 由 Toshiba，Time Warner，Matsushita Electric， 
lectric, Pioneer, Thomson 和 JVC。 

















DVD 表面 是 从 中 心 开始 的 螺旋 形 沟 槽 ， 无 论 读数 据 还 是 写 数据 都 是 从 中 心 开始 。 沟 槽 的 








形式 代表 了 一 种 不 能 


修改 的 标志 性 数据 ， 也 就 是 平常 所 说 媒体 标识 码 (Media Identification 


Code, MID)。MID 包含 了 预 录制 信息 , 如 生产 厂商 、 Ce 
一 般 情况 下 , 我 们 的 刻录 机 都 能 读 取 这 些 信息 ， 用 来 告诉 用 户 应 该 采取 何 种 方式 来 刻录 








同时 也 是 一 种 厂商 的 
2. DVD 的 容量 








标志 广告 。 




















DVD 的 外 观 尽 寸 和 CD 的 外 观 尺寸 很 相似 ， 直 径 都 是 120mm 或 者 80omm。CD 使 用 一 层 





到 很 好 的 保护 ， 由 于 


单 / 双 层 。 因 此 出 现 了 


料 基 片 ， 而 DVD 盘 则 不 同 ， 它 使 用 两 层 0.6mm 厚 的 基 片 ， 数 据 层 夹 在 中 间 ， 数 据 从 而 得 


这 种 双 层 结构 ， 使 得 DVD 的 制造 出 现 多 样 化 、 即 多 种 组 合 ， 单 / 双 面 ， 
DVD 规格 见 表 7-5。 


表 7-5 几 种 不 同 的 CD 产品 





规格 名 称 面 层 ( 共 ) | 直径 (cm) 

(GB) (GiB) 
DVD-! SS SL [SN 1 | _s 1.46 1.36 
DVD-2 SS DL [V1 | 2 KY 2.66 2.47 
DVD-3 DS SL 8 2.92 2.72 
DVD-4 Ds DL 8 5.32 4.95 
DVD-5 SS SL | 一 [SS | 2 4.70 4.37 
DVD-9 SS DL | 这 外 ”2 | 1 8.54 7.95 
DVD-10 DS SL 12 9.40 8.75 
DVD-14 DS SL+DL 12 13.24 12.33 
DVD-18 DS DL | 2 | “4 | 2 17.08 15.90 





注 : SS 一 单 面 DD: 





S 一 双 面 。 SL 一 单 层 ”DL 一 双 层 


3. DVD 的 速率 

DVD 的 写 入 速率 和 CD 的 速率 不 同 ， 一 倍速 的 DVD 速率 是 1 385KB/s(1 3S3KiB/s)。 目 
前 大 部 分 的 DVD 光驱 型 号 ， 都 可 以 达到 18 或 者 20 倍速 。 表 7-6 列 出 了 几 个 常见 的 速率 ， 其 
他 速率 可 以 通过 计算 得 出 。 


表 7-6 几 种 常见 的 DVD 的 速率 


写 入 时 间 (min) 
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OO 





单 层 双 层 
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4. DVD 格式 规格 

DVD 格式 规格 是 有 DVD 论坛 制定 的 , 主要 包括 视 计算 机 数据 格式 、 视频 格式 和 音频 格式 。 
(1) DVD-ROM: 用 于 记录 计算 机 数据 。 

(2) DVD-Video: 用 于 保存 视频 资料 。 

(3) DVD-Audio: 用 于 刻录 音频 资料 。 

(4) DVD-R: 一 次 性 刻录 光盘 。 

(5) DVD-RAM: 可 擦 写 刻录 光盘 。 

此 外 ， 由 于 DVD 标准 制定 时 就 存在 两 个 联盟 ， 因 此 还 出 现 以 下 另外 的 格式 。 

(1) DVD 十 R: 一 次 性 刻录 光盘 。 

(2) DVD 士 RW: 可 擦 写 刻录 光盘 。 

1) DVD-Video 格式 

DVD-Video 是 一 种 消费 级 视频 格式 ， ih 在 < 2 目前 在 亚洲 、 






































北美 、 欧 洲 和 澳大利亚 普遍 使 用 。 它 需要 一 个 DVD 3 一 个 MPEG-2 解码 器 。 注 意 ， 


DVD-Video 格式 描述 不 是 免费 使 用 的 ， 它 需要 5 000 美 > 


素 、 





























(1) DVD 视频 信息 。DVD 视频 帧 的 尺寸 由 过 也 有 不 同 的 标准 ， 主要 分 为 两 大 类 : 

@ 25 帧 / 秒 ， 隔 行 扫描 有 以 下 几 种 尺寸 :1.720X576 像素 、704X576 像素 、352X576 像 
352X288 像素 。 NS 、\ 

@ 29.97 帧 / 秒 ， 隔 行 扫描 有 WNR. oe 704X480 像素 、352X480 


像素 、352X240 像素 。 


式 。 官 方 允许 的 : 


下 面 的 尺寸 可 以 用 于 MPEGI 视频 。 x a 
GD 352X288 像素 25- 帧 s， 逐 行 扫描 。 “入 
©@ 352X240 像素 > 29.97 帧 8， 逐 行 扫描 。 SS 

(2) ne DVD 电影 中 的 音频 F 可 以 是 PCM、 DTS、MP2 或 者 Dolby Digital(AC3) 格 
可 格式 特性 如 下 。 

@ PCM: 48kHz 或 者 96kHz 采样 率 ，16 或 24 位 线性 PCM，2 到 6 个 声 道 ， 最 高 6 144kb/s。 
@ AC-3: 48kHz 采样 率 ，1 一 5.1 声 道 ， 最 高 448kb/s。 

@ DTS: 48kHz 或 者 96kHz 采样 率 ，2 一 6.1 声 道 ，768kb/s 或 者 1 536kb/s。 

@ MP2: 48kHz 采样 率 ，1 一 7.1 声 道 ， 最 高 912kb/s。 

DVD 支持 每 个 影片 最 多 8 个 音 轨 ， 每 个 音 轨 可 以 采用 不 同 的 音频 格式 或 者 不 同 的 语言 。 
(3) DVD 码 率 。 一 个 DVD 最 高 可 以 允许 的 码 率 达 到 11.08Mb/s， 去 掉 1.0Mb/s 的 益处 控 



































制 量 ,实际 可 用 的 最 高 码 率 为 10.08Mb/s。 其 中 字幕 最 多 允许 3.36Mb/s， 视频 和 音频 最 多 可 以 








使 














9.80Mb/s。 还 要 考虑 多 角度 视频 的 因素 ， 因 此 专业 的 视频 平均 码 率 一 般 位 4 一 5Mb/s， 峰 


值 为 7 一 8Mb/s， 这 样 可 以 兼容 大 多 数 DVD 播放 软件 和 设备 。 


(4) DVD 文件 结构 。 大 多 数 DVD 光盘 文件 使 用 UDF 格式 ， 它 合并 了 ISO 9660 格式 。 一 








般 DVD-Video 下 有 两 个 目录 : AUDIO_TS 和 VIDEO_TS。 其 中 AUDiOrS 目录 可 以 没有 或 
者 其 内 容 为 空 。 只 有 在 DVD Audio 的 光盘 中 才 需 要 该 目录 和 内 容 。 





VIDEO _TS 目录 存储 了 所 有 与 DVD-Video 相关 的 文件 ， 包 括 音 频 、 视 频 和 字幕 文件 。 一 


个 标准 的 VIDEO_TS 目录 包含 了 VOB、IFO 及 BUP 文 件 。 


Bo2 





| 


VOB 文件 ， 视 频 目 标 文件 (Video OBjects)， 其 中 含有 视频 、 音 频 、 字 幕 数 据 流 。 视 频数 
据 流 是 MPEG-2 格式 ， 音 频数 据 流 是 前 述 的 几 种 格式 。 字 幕 数据 流 由 字幕 图 片 文件 .sub) 和 字 
幕 索 引文 件 (idx) 组 成 ， 为 影片 提供 字幕 。 一 个 .sub 文件 可 以 包含 多 个 语言 字幕 。 字 幕 最 多 有 
32 种 字幕 。 

IFO 文件 ， 信 息 文 件 (InFOrmation)， 告 诉 DVD 播放 机 浏览 信息 ， 如 章节 的 开始 时 间 、 伴 
音 流 的 位 置 ， 字 幕 的 位 置 。 实 际 上 VOB 文件 是 电影 本 身 ， 而 IFO 文件 是 目录 索引 ,把 电影 的 
各 个 片段 关联 在 一 起 。 

BUP 文件 ， 备 份 文件 (BackUP)， 和 IFO 文件 完全 相同 。 若 光盘 种 的 IFO 文件 读 不 出 ， 则 
[以 通过 BUP 文件 来 实现 IFO 文件 的 功能 。 
(5) 内 容 扰乱 系统 。 内 容 扰乱 系统 (Content Scramble System，CSS) 是 用 来 防止 用 户 直接 复 
制 光 盘 内 容 的 机 制 方案 。CSS 最 早 在 1996 年 由 DVD 论坛 设计 研发 , 它 把 一 个 40 位 的 密 钥 放 
的 导入 区 , 这 个 区 只 能 通过 特别 的 方式 读 取 ， 剩余 的 真正 的 了 内 容 扇 区 则 是 加 密 的 ， 
防止 用 户 直接 复制 VOB 文件 。 此 外 ，DVD-R 盘 片 种 ， 密 钥 处 的 区 是 不 能 修改 刻录 的 ， 
了 光盘 复制 ， 但 是 DVD 十 R 是 允许 刻录 的 。 AS 
尽管 如 此 ， 在 1999 年 ，Jon Lech Johansen 和 男 外 宙 人 各 序 员 采 到 向 工程 方法 ， 破 解 了 
CSS 机 制 ， 写 出 了 一 小 段 代码 DeCSS 来 去 除了 该 限制。 现在 CSS 方法 已 经 从 技术 上 无 法 做 
到 防 复制 。 市 面 上 有 多 个 小 程 序 可 以 用 来 复制 汪 稚 )、 以 及 从 中 分 离 音 视 频 和 字幕 流 。 

(6) 地 区 码 。 每 一 个 DVD-Video 光盘 都 含 -一 个 或 多 个 地 区 码 ， 用 于 指明 该 碟 片 只 能 在 指 
定 的 区 域 播放 。DVD 播放 设备 按照 4 定 必须 中 能 播放 该 区 域 的 DVD-Video, 不 能 播放 其 他 区 
域 的。 这 主要 是 保障 了 DVD- Video 的 内 容 生产 商 ， 主要 是 电影 制作 方 的 利益 ， 也 可 以 分 批 按 
照 不 同 的 国家 发 行 不 同 的 版 本 :实际 上 ， 由 于 CSS 9 被 解 ,以 及 不 是 所 有 播放 设备 都 严格 过 
守 地 区 码 的 限定 ， 地 区 码 在 版 权 意识 芭 弱 的 地 域 作 用 不 天 。 
注意 ， 没有 地 区 码 的 光盘 可 以 在 有 
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也 区 码 有 以 下 几 个 ，@ 加 拿 大 、 dee pe @ 欧 洲 (俄罗斯 、 白 俄 罗 
0 乌克兰 除外 )S\ 中 东 ( 仅 传统 中 东 地 区 )、 南 非 、 斯 威 士 兰 、 莱 索 托 、 格 陵 兰 、 日 本 、 法 国 
海外 领地 (如 法 属 圭亚那 )，@ 韩 国 、 站 @ 黑 西 哥 、 中 美洲 、 南 美洲 (法 属 圭亚那 除外 )、 
加 勒 比 地 区 (波多 笋 各 除外 )、 大 洋 洲 (新 喀 里 多 尼 亚 除外 )，@@ 俄 罗斯 、 白 俄罗斯 、 乌 克 兰 、 非 
洲 (埃及 、 南 非 、 斯 威 士 兰 、 莱 索 托 除外 )、 中 亚 、 南 高 加 索 国家 、 南 亚 、 阿 富 汗 、 蒙 古 、 朝 鲜 ; 
@ 中 国 ，@ 预 留 ， @ 国 际 管辖 地 区 ， 如 飞机 及 客轮 内 ; 地 区 ALL 全 区 码 ， 是 任何 区 码 ( 即 1 一 
6 区 码 选 择 其 中 一 个 ) 的 DVD 播放 机 可 播放 光盘 ; 地 区 0 光盘 没有 设置 标志 。 
2) DVD-Audio 格式 
DVD-Audio 是 通过 DVD 光盘 来 发 布 高 质量 音乐 的 格式 。 它 和 DVD-Video 目的 不 一 样 ， 
尽管 DVD-Video 也 包含 声音 。 其 对 比 类 似 于 VCD 和 CD 的 区 别 。 
第 一 个 DVD-Audio 光盘 在 2000 年 面世 。 它 一 直 处 于 和 Super Audio CD(SACD) 格 式 争 斗 
中 ， 最 终 ， 两 个 都 没有 能 够 在 消费 市 场 中 胜出 。 相 对 于 CD 格式 的 音乐 ， DVD-Audio 具有 如 下 
优点 。 
(1) 无 论 从 时 间 长 度 还 是 音乐 质量 ， 可 以 容纳 更 多 音乐 。 
(2) 高 质量 的 音乐 ， 表 现在 高 码 率 的 采用 率 。 
(3) 额外 的 声 道 
(4) 鉴于 其 市 场 占有 率 非常 低 ， 多 数 用 户 没有 接触 过 DVD-Audio， 在 此 不 再 资 述 。 
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7.1.6 ”HD DVD 和 蓝光 光盘 


蓝光 光盘 (Blu-ray Disc，BD) 是 DVD 之 后 的 下 一 代 光 盘 格 式 之 一 ， 用 以 存储 高 品质 的 影 
音 和 高 容量 的 资料 。 最早 是 由 Sony 和 松下 电器 等 企业 组 成 的 “蓝光 光盘 联盟 ”策划 的 光盘 规 
格 ， 并 以 Sony 为 首 于 2006 年 开始 全 面 推动 相关 产品 。 

蓝光 光盘 的 命名 是 由 于 其 采用 波长 405nm 的 蓝 色 激光 光束 来 进行 读 写 操作 。 蓝 光 光 盘 的 
英文 名 称 之 所 以 不 是 “Blu-ray”， 主 要 是 “Blu-ray Disc” 在 欧美 地 区 比较 流行 通俗 、 口 语 化 ， 
不 能 用 来 注册 商标 ， 所 以 去 掉 了 一 个 字母 e 来 注册 商标 。 

2008 年 2 月 ， 随 着 HD-DVD 领导 者 东芝 宣 布 结束 所 有 HD DVD 相关 业务 ， 持 续 多 年 的 
下 一 代 光 盘 格 式 之 争 结束 ， 最 终 由 Sony 主导 的 蓝光 光盘 胜出 。 

一 个 单 层 的 蓝光 光盘 容量 为 23GB， 足 够 录制 一 个 长 达 4 小 时 后 的 高 清晰 电影 。Sony 声称 以 
6X 倍速 烧 录 单 层 25GB 的 光盘 只 需要 大 约 50min， ed 50GB， 足 够 录 一 个 
长 达 8 小 时 的 高 清晰 电影 。2010 年 6 月 指定 的 BDXL 格式 ， 支 Sql B 和 128GB 的 光 稚 。 

蓝光 光盘 同样 有 版 权 保护 机 制 , 主要 有 3 种 方式 : AACSCAivahced Access Content System， 
高 级 访问 控制 系统 )， 以 及 BD 十 和 ROM Mark， 但 是 前 已 有 相应 的 破解 方式 ， 所 以 技术 上 
亦 未 能 防止 内 容 复制。 NS- 

蓝光 光盘 的 文件 系统 为 CDFS， 不 同 于 了 UDF. 

HD DVD(High Definition DVD， 高 清晰 DVD)， 是 一 种 以 蓝光 激光 技术 存储 数字 内 容 的 光 
盘 格 式 。 它 的 大 小 和 CD 一 样 都 是 120min' 其 激光 波长 为 405nm， 由 东芝 O、NEC、 三 洋 电机 等 
企业 组 成 的 HD DVD 推广 联盟 负责 推广 Microsoft、 Intels 环球 影 业 相继 加 入 HD DVD 阵营 
但 是 在 2008 年 ， 华 纳 公司 宣布 脱离 HD DVD， 美国 数 家 连锁 卖场 宣布 支持 蓝光 光盘 ， 东 芝 
司 于 当年 2 月 宣布 终止 HDIDVD 事业 ， 该 阵营 失败 ， 扒 出 了 高 清晰 高 容量 光盘 格式 竞争 。 

HD DVD 单 面 单 层 容量 为 15GB， 单 面 双 层 为 30GB， 远 低 于 蓝光 光盘 。 但 是 其 向 后 兼容 
DVD， 便 于 “ 噶 稍 作 改 动 即 可 支持 HDDVD 的 生产 。 

Sd 


7.2 ”可 移动 存储 设备 
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可 移动 存储 设备 主要 是 用 来 在 不 同 终端 之 间 移 动 的 存储 设备 ， 方 便 资料 存储 与 读 取 。 这 
些 终端 设备 可 以 是 台式 计算 机 、 便 携 式 计算 机 、 数 码 照 相机 、 数 码 录 像 机 、 手 机 等 需要 存储 
功能 的 电子 设备 。 早 在 20 世纪 ， 就 有 了 软盘 作为 可 移动 存储 设备 ， 但 是 软盘 的 容量 很 小 只 
有 1.2MB 和 1.44MB， 而 体积 较 大 、 易 损 。 因 此 随 着 对 容量 需求 的 提高 ， 软 盘 逐 渐 淡 出 了 存 
储 领 域 。 其 后 ， 出 现 了 形形色色 的 可 移动 存储 设备 ,如 PD 光驱 、MO 磁盘 、 活 动 硬盘 等 设备 ， 
而 电子 闪存 技术 的 发 展 ， 引 入 了 真正 便携 的 各 式 存 储 卡 ， 这 些 存 储 卡 体积 小 、 速 度 快 、 容 量 
大 ， 逐 步 进 入 了 数码 产品 领域 。 

下 面 将 介绍 几 种 比较 常见 的 可 移动 存储 设备 。 


7.2.1 存储 卡 


1.， PCMCIA 存储 卡 
PCMCIA 存储 卡 ， 简 称 PC 卡 ，PCMCIA 是 Personal Computer Memory Card International 
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Association 的 缩写 ， 是 专 为 便携 式 计算 机 设计 的 外 设 接口 。PC 卡 的 标准 就 是 由 PCMCIA 联盟 指 
定 的 ， 该 联盟 由 美国 的 计算 机 业界 公司 指定 的 用 来 扩展 记忆 存储 的 一 种 标准 。 同 期 还 有 由 Jacob 
D. Holm 于 1986 年 发 明 的 JEIDA 记忆 卡 标准 ,在 1991 年 两 个 标准 合并 称 为 PCMCIA 2.0(PC 卡 )。 
PC 卡 最 早 设 计 的 初衷 是 计算 机 存储 扩展 。 但 是 目前 的 使 用 已 经 扩展 到 大 部 分 外 设 ， 如 网 
卡 、Modem 和 外 接 硬盘 。 这 种 卡 也 用 在 数码 照相 机 中 ， 如 Kodak DCS 300 系列 。 反 而 作为 存 
储 用 的 越 来 越 少 。 
目前 ， 大 多 数 便携 式 计算 机 中 还 是 可 以 找到 PC 卡 的 插 槽 。 
2. Compact Flash 卡 


Compact Flash(CF) 卡 是 用 在 便携 设备 上 的 一 种 大 容量 存储 设备 格式 。 该 格式 最 早 由 
SanDisk 公司 在 1994 年 发 布 并 生产 。 现 在 在 众多 设备 上 使 用 ， 大 多 数 使 用 闪存 技术 ， 但 是 部 
分 产品 ， 如 Microdrive 使 用 内 置 硬盘 。 

CF 卡 目 前 依然 在 很 多 领域 发 挥 作用 ,并 且 支 持 新 的 设备 ， 如 206 秆 ， Sony 在 HVR-MRCIK 
摄像 机 中 选择 CF 卡 作为 存储 设备 。2010 年 ，Canon 选择 CE 打 作 为 数码 照相 机 中 的 摄像 存 
储 。2010 年 开始 ，Sony、Nikon 开始 研发 新 的 CF 卡 , 该 卡 目 标 速率 达到 1Gb/s(125MB/s), 
并 且 容 量 高 达 2TiB， 主 要 用 于 高 清 摄 像 存储 。 

CF 接口 有 50 个 针脚 ， 是 68 针 的 PCMCIAL. FE 测 果 呈 所 以 可 以 插入 68 针脚 的 PCMCIA II 

型 卡 槽 中 。CF 接口 可 以 根据 模式 针 来 决定 是 46` 位 的 PC Card 或 者 一 个 扑通 IDE(PATA) 接 口 。 
要 F 设备 运行 在 3.3V 或 者 SV HE 上 ,并 支 持 C-H-S 或 者 128 位 LBA 寻 址 方式 。CF 卡 类 似 
普通 硬盘 ， 也 可 以 设置 位 主 盘 或 者 从 盘 、 

CF 卡 也 有 一 个 周 速 的 概念 , 米 源 于 CD 的 倍 速 概念 六 倍速 和 CD 的 一 倍速 是 一 个 速 
率 ， 也 就 是 150KB/s。 例 如 ,“ 下 133X 倍 速 的 CF- 人 其 实际 传输 速率 为 133*150KB/s= 
19 950KB/s~20MB/s。 一 

CF 卡 的 容量 可 以 达到 137GB(128GiB)。 206 年; CF 卡 使 用 磁性 材料 作为 存储 媒介 ， 

随 着 固态 CF 卡 的 发 展 》 可 以 提供 越 来 越 高 的 容量 。 其 文件 系统 可 以 使 用 FAT、FAT32、 人 
JFS 和 NTFS 等 流行 的 文件 系统 。 


3. SD 卡 


Secure Card(SD) 卡 是 由 SD 卡 联盟 开发 的 一 种 可 持续 保存 的 记忆 卡 格式 , 主要 用 于 便携 式 
设备 ， 如 数码 照相 机 、 数 码 摄像 机 及 手机 等 。SD 技术 在 超过 400 多 个 品牌 上 使 用 ， 且 有 超过 
8000 个 型 号 ， 使 用 范围 非常 广 。 目 前 大 部 分 手机 上 都 是 用 该 存储 卡 。 

SD 卡 包含 : SDSC( 标 准 容量 存储 卡 ), SDHC(Secure Digital High Capacity, 高 容量 存储 卡 )、 
SDXC(Secure Digital extended Capacity, 高 扩展 容量 存储 卡 ) 及 SDIO(Secure Digital Input/Output， 
输入 输出 卡 )。 

SD 卡 从 外 形 上 也 有 3 种 尺寸 : 原始 大 小 的 卡 (Original)、 小 卡 (Micro)、 迷 你 卡 (Mini)。 其 
外 形 尺寸 和 重量 见 表 7-7。 




























































































































































































表 7-7 SD 卡 的 外 形 标准 尺寸 
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SD 卡 的 外 形 如 图 7.7 所 示 。 

1) SDHC 卡 

SDHC 卡 是 在 第 二 个 版 本 的 SD 描述 中 定义 的 。 它 支持 容量 高 达 
32GB。SDHC 卡 从 物理 上 和 电子 线路 上 跟 SDSC 卡 是 一 样 的 。 两 者 
主要 区 别 在 于 卡特 别 数据 (card specifi data，CSD) 的 定义 不 同 。 此 外 ， 
SDHC 卡 预 置 的 文件 系统 为 FAT32 文件 系统 。 能 够 识别 SDHC 卡 的 
设备 要 求 能 够 识别 SDSC 卡 ， 但 是 反 过 来 ， 识 别 SDSC 卡 的 设备 不 
一 定 识 别 SDHC 卡 。 有 些 设备 可 以 通过 升级 固件 来 识别 ， 操 作 系 统 
可 能 也 需要 升级 或 者 打 补 丁 才 能 识别 ,如 Windows XP SP3 之 前 的 系 
统 及 Windows Vista SP1 之 前 的 版 本 都 不 识别 SDHC 卡 。 

2) SDXC 卡 

SDXC 卡 最 引 人 注 目的 是 它 的 容量 可 以 达到 2TB(2048GB)。 它 
要 求 识别 SDXC 卡 的 设备 必须 识别 SDHC 卡 和 SDSC 卡 纺 它 最 早 是 在 2009 年 消费 者 电子 展 
上 宣布 的 。 同 期 Panasonic 宣布 执照 64GB 的 SDXC 卡 。 

SDXC 预 置 的 文件 系统 是 exFAT, 支持 SDXC 所 的 操作 系统 有 Windows 7，Windows Vista 
SP1 后 续 版 本 ，Windows XP SP2 或 SP3 加 KB955704 补丁 ，Windows Server 2008 SP1 后 续 版 
本 , Windows Server 2003 SP2 或 SP3 加 B955704 补丁 , Windows CE 6.0 以 后 版 本 ; Apple Mac 
OS X Snow Leopard 10.6.5 以 后 版 本 及 YOS X Lion 10.7。BSD 及 Linux 受 限 于 专利 授权 ， 支 持 
SDXC 卡 但 是 不 支持 exFAT 格式 ? 

3) SD 卡 的 速度 

SD 卡 的 速度 是 指 从 卡 利 读 取 或 写 入 数据 的 快慢 程度 。 在 早期 的 SD 卡 中 ， 使 用 了 一 个 跟 
CD 一 样 的 倍速 。 目 前 和 官方 的 定义 单位 为 速度 评级 ， 它 保证 了 数据 可 以 写 入 的 最 小 速率 ， 所 
谓 的 最 小 速率 必须 是 8Mb/s(1MB/s) 的 倍数 “官方 定义 了 以 下 几 个 级 别 见 表 7-8。 

















7.7 3 种 SD 卡 的 外 形 








表 7-8 官方 定义 的 级 别 














Class 速率 
css 2 2MB/s 
@clss4 4MB/s 
cs; 6 6MB/s 

Class 10 10MB/s 











同时 ， 倍 速 的 概念 ， 用 来 表示 SD 卡 在 理想 状态 下 读 写 速度 是 标准 CD-ROM 基本 速度 
1.2Mb/s(150KB/s) 的 多 少 倍 。 
注意 ， 评 级 是 速度 下 限 ， 而 倍速 则 是 速度 的 上 限 。 
个 普通 卡 的 数据 传输 速度 是 6 倍速 ， 也 就 是 7.2Mb/s。 在 2.0 描述 中 定义 了 最 高 200 倍 
速 。 但 是 市 面 上 部 分 厂商 注 明 了 自己 的 卡 的 速度 是 读 取 速 度 ， 一 般 情况 下 ， 读 的 速度 要 比 
写 入 速度 快 。 像 Transcend 和 Kingston 则 注 明 了 写 入 速度 。 表 7-9 列 出 倍速 的 速率 及 与 评级 的 
比较 。 
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表 7-9 SD 卡 常用 的 倍速 及 评级 















































倍速 读 速度 (MB/s) 写 速度 (MB/s) 速度 评级 
6xX 0.9 
10X LL 
13x 2.0 2.0 2 
26X 4.0 4.0 4 
32Xx 4.8 5.0 5 
40xX 6.0 6.0 6 
66X 10.0 10.0 10 
100X 15.0 15.0 
133X 20.0 20.0 
150X a 22.5 
200x 30.0 30.0 
266X 40.0 40.0 
300Xx 45.0 45.0 
400X 60.0 60.0 
600X 90.0 90.0 
4. 多 媒体 卡 
多 媒体 记忆 卡 (Multimedia Card, , MMC) 公司 是 一 种 闪存 记忆 卡 标准 ， 由 SanDisk 公司 和 
Siemens AG 公司 在 1997 年 发 布 ,由 于 它 菇 于 Toshiba 的 NAND 闪存 , 因此 它 的 尺寸 比 基 于 Intel 


的 NOR 记忆 卡 (如 CF 卡 ) 要 小 :MMC 的 尺寸 大 约 只 有 半 枚 邮票 大 小 : 24mm*32mm*1.4mm。 

MMC 最 早 使 用 每 秒 汪 位 的 传输 接口 , 后 来 发 展 到 每 秒 传输 4 或 8 位 , 大 大 提高 了 传输 速 
率 。 但 是 由 于 SD 卡 的 出 现 ， 其 地 位 逐渐 被 SD 卡 取代 ， 但 是 仍 有 大 量 支持 SD 卡 的 设备 支持 
MMC， 如 某 些 智能 手机 。 

MMC 的 容量 最 高 可 达 128GB， 在 手机 、 数 码 音乐 播放 器 、 数 码 照 相机 和 PDA 等 设备 中 
广泛 使 用 。 

MMC 也 有 多 种 类 型 ， 如 小 尺寸 的 多 媒体 卡 (Reduced-Size MultiMedia Card，RS-MMC)、 
双 电 压 多 媒体 卡 (Dual-Voltage MultiMedia Card, DV-MMC), MMCplus、MMCmobile、 
MMCmicro、SecureMMC、eMMC、MiCard 等 类 型 。RS-MMC 的 尺寸 只 有 24mm*18mm*1.4mm。 
它 是 在 2004 年 发 布 的 ， 不 过 它 只 有 两 个 硬件 授权 商 : 诺基亚 和 西门 子 。 他 们 将 RS-MMC 用 于 诺 
基 亚 的 60 系列 Symbian 智能 电话 、 诺 基 亚 770 互联 网 平板 计算 机 及 西门 子 的 65 和 75 产品 。 

5. Memory Stick 


Memory Stick( 记 忆 棒 ) 是 一 种 可 移动 闪存 卡 格式 ， 由 Sony 在 1998 年 发 布 的 ， 并 在 Sony 

的 大 量 数码 设备 中 使 用 。 在 最 早 的 记忆 卡 基础 上 ， 进 而 研发 了 Memory Stick PRO， 人 允许 更 高 

容量 ， 以 及 更 快 的 传输 速率 。 之 后 出 现 了 Memory Stick Duo， 一 种 更 小 的 Memory Stick， 以 

及 更 加 微小 的 Memory Stick Micro(M2)。 在 2006 年 ，Sony 又 发 布 了 Memory Stick PRO-HG， 
来 支持 数码 摄像 机 ， 以 一 种 更 快 的 速度 来 传输 录制 高 清 视频 。 

记忆 棒 的 容量 在 1998 年 发 布 时 只 有 128MB, 目前 支持 32GB，Memory Stick PRO 则 允许 

理论 最 大 值 2TB。 随 着 SD 卡 的 发 展 ,2010 年 开始 , Sony 开始 并 行 支持 SD/SDHC 卡 和 Memory 
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, Stick 两 种 格式 , 再 后 来 Sony 也 开始 制造 SD 卡 , 但 Sony 一 致 保持 Memory Stick 的 继续 研发 。 


6.， 其 他 存储 卡 


1) SxS 

SxS(S-by-S) 是 一 种 兼容 Sony 和 Sandisk 创造 的 ExpressCard 标准 的 闪存 记忆 卡 标准 。 它 
的 主要 特点 时 传输 速率 达到 800Mb/s， 高 峰 时 可 以 达到 2.5Gb/s。Sony 在 XDCAM EX 摄像 机 
中 使 用 该 存储 卡 ， 用 来 记录 1080P 的 高 清 视频 。 其 价格 较为 昂贵 。 
2) xD-Picture 卡 
该 卡 也 是 使 用 闪存 技术 的 存储 卡 格式 ， 一 般 在 较 老 的 数码 照相 机 中 使 用 ， 它 的 容量 从 
16MiB 到 2GiB。 最 早 由 Olympus 和 Fujifilm 开发 ， 并 在 2002 年 面世 。Toshiba 和 Samsun 电 
子 为 Olympus 和 Fujifilm 制造 该 存储 卡 。xD-Picture 卡 在 格式 战争 中 ， 逐 渐 被 SD 卡 取代 ， 本 
来 在 手机 、 个 人 计算 机 、 数 码 音乐 播放 器 中 广泛 使 用 ， 但 也 逐渐 jl > 了 市 场 。 

3) SM 卡 

SM(Smart Media) 卡 ,是 一 种 闪存 卡 , 由 Toshiba 公司 在 1 全 与 MiniCard、Compact 
Flash 和 PC Card 竞争 。 它 最 早 被 称 为 “固态 软盘 卡 ” , ,并 度 认为 是 软盘 的 痊 代 者 。 

SM 卡 用 在 数码 照相 机 、 数 码 音乐 播放 器 和 PDAL 设备 上 ，SM 卡 是 在 塑料 卡 上 嵌入 一 块 
NAND 闪存 EEPROM 芯片 ， 鉴 于 这 种 技术 ， 使 得 它 江 度 是 最 薄 的 存储 卡 之 一 -， 只 有 0.76mm 
厚度 。 与 其 他 存储 卡 比 ， 它 性 价 比 高。 但 是 人 它 自身 不 包 含 控 制 电路 ， 导 致 了 很 大 的 麻烦 ， 在 

一 些 较 老 的 设备 上 必须 升级 固件 才能 支持 大 容量 SM 卡 。 

SM 卡 在 2001 向 用 用 有 了、 用 了 在 格式 战争 中 类 利 ， 逐 潮 退 

出 了 市 场 。 x 


4X x 


7.2.2 USB 移动 存储 设备 人 


通用 串 行 总 线 (Gersal Serial Bus， -个 串口 总 线 

也 是 一 -种 输入 输出 接口 技术 规范 ， 广 泥 应 用 : 于 个 人 计算 机 和 移动 设备 之 间 的 信息 通信 
产品 ， 并 扩展 至 摄影 器 材 、 数 字 电视 机 (机 项 盒 ) 及 游戏 机 等 相关 领域 。 

USB 最 初 是 由 Intel 和 Microsoft 倡导 发 起 的 。 其 最 大 的 特点 是 支持 热 插 拔 和 即 插 即 用 。 
当 设备 插入 时 ， 主 机 检测 到 该 设备 并 加 载 所 需 的 驱动 程序 ， 因 此 在 使 用 上 比 PCI 和 ISA 总 线 
方便 ， 也 为 各 种 外 设 连 入 计算 机 提供 了 极 大 的 方便 性 。 
外 ，USB 的 速度 远 比 并 行 端口 、 串 行 端口 等 传统 标准 总 线 快 ，USB 1.1 的 最 大 传输 带 
宽 为 12Mb/s，USB 2.0 则 达到 了 480Mb/s， 到 了 现在 的 USB 3.0 则 一 步 提升 到 5Gb/s。 
正 是 USB 接口 的 便利 性 、 高 速 性 为 我 们 提供 可 移动 存储 提供 了 可 能 。 

(1) IEEE 1394 接口 ,又 称 火线 (FireWire) 接 口 ， 是 由 Apple 公司 领导 的 开发 联盟 发 布 的 一 
种 高 速 传输 接口 。IEEE 1394 接口 由 Apple 所 创 ， 其 他 制造 商 通过 授权 获得 生产 ， 由 于 
“FireWire” 被 Apple 计算 机 登记 为 商标 ， 因 此 其 他 制造 商 采 用 了 不 同 的 名 称 ，Sony 产品 称 该 
接口 为 1Link， 德 州 仪器 则 称 为 Lynx。 

IEEE 1394 理论 上 可 以 将 64 台 装 置 串联 在 同一 网 络 上 。 传 输 速度 有 100Mb/s、200Mb/s、 
400Mb/s 和 800Mb/s， 目 前 已 经 达到 1.6Gb/s 和 3.2Gb/s 的 速率 。 
由 于 IEEE 1394 内 部 矛盾 ， 造 成 该 技术 在 市 场 上 的 推广 时 机 延误 ， 加 之 Apple 公司 要 收 
取 许 可 费 ,造成 大 量 公 司 转向 USB 2.0 接口 。 从 技术 上 来 说 , IEEE 1394 继承 了 成 熟 的 SCSI 指令 
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体系 ， 传 输 稳定 、 效 率 较 高 、CPU 负担 较 低 、 实 际 传输 速度 高 于 USB 2.0。 
(2) Thunderbolt 接口 。Thunderbolt, 原先 计划 代号 为 Light Peak， 由 Intel 发 布 的 连接 器 标 
准 ， 支 持 铜 线 与 光纤 两 种 媒介 ， 用 于 计算 机 和 其 他 装置 的 通用 总 线 。2009 年 ，Intel 在 英特尔 
科技 论坛 上 发 表 这 个 技术 ， 目 前 已 经 在 Apple 的 MacBook Pro 中 使 用 。 
Thunderbolt 接口 目前 支持 双向 同步 传输 速度 可 达 10Gb/s， 可 以 用 来 连接 DVI、 
DisplayPort、SCSI、SATA、USB、FireWire、PCI Express 与 HDMI 等 接口 ， 成 为 计算 机 对 外 
的 单一 总 线 。Promise 已 经 发 布 了 Pegasus 存储 产品 ， 用 于 Apple 计算 机 的 后 备 存储 。 
.移动 硬盘 
移动 硬盘 是 在 硬盘 外 面 安装 一 个 硬盘 盒 ， 通 过 该 硬盘 为 该 硬盘 供电 ， 并 提供 一 个 通道 用 
于 硬盘 和 其 他 计算 机 通信 。 通 过 这 种 方式 ， 可 以 把 本 应 固定 在 机 箱 里 的 硬盘 独立 出 来 ， 变 为 
可 以 接 驭 多 台 计 算 机 的 可 移动 存储 设备 。 A 
移动 硬盘 接 驳 到 计算 机 上 的 连接 接口 有 多 种 : USB、 Foe eSATA。 目 前 较为 流行 
的 是 使 用 USB。 USB 供电 5V 电压 , 可 以 为 内 部 的 硬盘 提供 电 为 支持 。 由 于 计算 机 机 箱 的 USB 
接口 的 电力 供应 能 力 不 一 定 相同 ， 有 些 插 在 机 箱 前 段 的 :$B 口 可 能 比 机 箱 后 背 上 的 USB 口 
电源 能 力 差 ， 因 此 有 些 USB 线 缆 采 用 了 3 头 设计 > 其 中 一 端 连接 移动 硬盘 ， 另外 两 端 都 插入 
到 机 箱 上 的 USB 口 ， 供 电 从 两 个 USB 口中 获取 ; 议 满 足 硬盘 的 电力 需求 。 
移动 硬盘 具有 如 下 特点 。 A 
(1) 容量 大 。 移动 硬盘 的 容量 是 内 部 硬盘 的 容量 ， 因此 ， 如 果 容 量 不 满足 实际 需求 ， 可 以 
通过 更 换 大 容量 的 内 部 硬盘 来 扩容 s 2 
CO) 数据 传输 速率 高 。 目前 天 部 分 移动 硬盘 采用 USB 2.0 接口 理论 上 可 以 达到 480Mb/s。 
(3) 可 靠 性 高 。 数 据 的 可 靠 性 ， 依 束 于 硬盘 的 可 多 性 ， 而 硬盘 在 几 二 年 的 技术 发 展 中 已 经 
非常 成 熟 。 2 和 | es 
但 是 移动 硬盘 也 其 有 如 下 缺点 。 。 
(1) 体积 较 大 ”尽管 硬盘 有 3 种 尺寸 ，3.5in、2.5in 及 1.8in， 但 是 相对 于 各 种 存储 卡 或 者 
后 续 介 绍 的 U 盘 来 说 ， 其 尺寸 还 是 非常 大 。 
(2) 脆弱 性 。 由 于 硬盘 是 机 械 装置 ， 因 此 在 数据 操作 过 程 中 ， 不 能 随便 移动 硬盘 ， 防 止 物 
理 损伤 。 在 移动 过 程 中 ， 需 要 小 心 轻 放 。 
2.， 内 存盘 


闪存 盘 ( 又 称 U 盘 )， 是 一 种 利用 闪存 来 进行 数据 存储 的 介质 ， 通 常 使 用 USB 插头 来 连接 
计算 机 。 闪 存盘 具有 体积 小 、 重 量 轻 、 可 热 插 拔 及 可 重复 写 入 ， 因 此 一 经 面世 即 取 代 了 软盘 
及 软驱 。 近 代 的 各 类 操作 系统 如 Windows、Linux、Mac OS X 及 UNIX 等 都 默认 支持 闪存 盘 。 
自 1998 年 至 2000 年 间 ， 很 多 公司 都 宣称 自己 是 第 一 个 发 明 闪 存盘 的 。 但 是 Trek 公司 是 
第 一 个 在 市 场 上 销售 以 闪存 为 介质 的 USB 数据 存储 器 的 公司 。 我 国 的 朗科 (Netac) 科 技 在 1999 
年 研发 出 自主 知识 产权 的 U 盘 并 声称 为 全 球 第 一 款 。SanDisk 前 身 公 司 在 1998 年 开始 研发 这 
种 设备 ， 并 于 1999 年 10 月 注册 了 diskonkey.com 域名 。 

目前 常用 的 闪存 盘 的 核心 芯片 有 3 种 类 型 。 

@ SLC，Single-Level Cell: lbit/cell， 速 度 快 寿命 长 ， 价 格 较 贵 ， 是 MLC 的 3 倍 以 上 ， 
约 10 万 次 擦 写 寿命 。 
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一 ”加 MLC, Multi-Level Cell: 2bit/cell, 速度 一 般 寿命 也 一 般 , 价格 也 便宜 , 约 3 000 一 10 000 


次 擦 写 寿命 

@ TLC，Triple-Level Cell: 3bit/cell， 速 度 慢 寿命 也 短 ， 价 格 相对 最 便宜 ， 约 500 次 擦 写 
寿命 。 
目前 ， 大 多 数 厂商 采用 的 MLC 芯片， 偶 有 部 分 闪存 盘 采 用 SLC 芯片 。 
对 大 多 数 用 户 来 说 ， 在 选择 闪存 盘 的 时 候 ， 应 当 首选 考虑 最 新 的 USB 3.0 接口 的 ， 容 量 
较 大 的 ， 这 样 在 读 写 速度 上 比 USB 2.0、 容 量 小 的 闪存 盘 要 快 得 多 。 


7.3 ”网络 存储 技术 























随 着 信息 资源 的 爆炸 式 增长 ， 以 及 网 络 在 人 们 生活 、 工 作 当 中 的 应 用 普及 ， 各 类 信息 都 
数字 化 ， 导 致 海量 数字 信息 需要 存储 。 原 来 的 计算 机 中 的 内 置 硬 总 不 能 满足 需要 。 此 外 ， 
数据 的 重要 性 ， 让 我 们 认识 到 不 能 单 靠 普通 硬盘 的 方式 来 保 在 改 还 必须 有 健全 的 数据 保障 方 
案 ， 除 了 必要 的 备份 机 制 外 ， 还 需要 考虑 容 灾 的 问题 而 对 影视 频 编辑 的 工作 来 说 ， 对 存 
储 提出 了 更 高 的 要 求 ， 希 望 在 传输 速率 上 能 够 尽量 j 这 些 也 是 传统 硬盘 不 能 独立 解决 的 
问题 。 在 这 种 背景 下 ， 网 络 存储 发 展 了 起 来 ， Sa 目 前 应 用 比 斩 广泛 的 几 种 网络 丰 人 


方案 。 水 
本 
7.3.1 直接 附加 存储 > 


直接 附加 存 A DAS) 是 指 了 服务 中 工作 站 的 数字 存储 
系统 ， 它 们 之 间 不 通过 网 络 中 介 一 个 典型 的 we -个 硬盘 柜子 内 置 数 个 硬盘 ， 青 
通过 一 个 HBA 卡 直 接连 接 到 计算 机 。 
使 用 DAS 最 大 的 问题 是 会 造成 公认 的 信息 防 。 存储 在 DAS 上 的 数据 无 法 让 其 他 计算 
机 设备 直接 访问 、 机 后 续 介绍 的 NAS， SAN 等 网 络 存储 则 避免 了 该 问题 。 


73.2 网 络 附 加 存储 


网 络 附加 存储 (Network-Attached Storage，NAS) 是 指 接 入 到 计算 机 网 络 中 为 不 同 架构 的 客 
户 端 提供 文件 系统 级 别 的 计算 机 数据 存储 。NAS 不 仅仅 是 一 个 文件 服务 器 ， 它 还 可 以 执行 特 
定 的 任务 。2010 年 , NAS 设备 得 到 了 广泛 的 使 用 , 使 得 多 台 计 算 机 之 间 共 享 数据 变 得 很 方便 。 
与 文件 服务 器 相 比 ，NAS 具有 快速 数据 访问 、 容 易 管 理 及 简单 配置 等 优点 。 

NAS 一 般 是 通过 网 络 文件 共享 协议 来 提供 访问 的 ， 常 用 的 文件 共享 协议 有 NFS、 
SMB/CIFS 及 AFP。 

NAS 单元 通常 是 一 个 简单 的 接 入 网 络 的 计算 机 ， 它 只 提供 文件 级 的 数据 存储 服务 。 在 其 
上 运行 一 个 简化 过 的 操作 系统 , 如 FreeNAS, 一 个 开源 的 专 为 PC 硬件 开发 的 NAS 解决 方案 ， 
实际 上 是 FreeBSD 的 简化 版 。NAS 系统 内 一 般 包含 多 个 硬盘 ， 这 些 硬盘 建立 RAID 磁盘 矩阵 
来 实现 管理 。 


7.3.3 ”存储 区 域 网 络 
存储 区 域 网 络 (Storage Area Network，SAN) 是 一 个 专门 提供 集中 化 的 块 级 数据 存储 的 网 
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络 。 有 了 SAN， 了 磁盘 
备 。SAN 通常 与 常 
出 于 历史 原 























， 数 据 中 心 最 初 都 是 


阵列 、 磁 带 库 及 关 学 存储 设备 ， 就 像 直 
的 计算 机 网 络 不 相连 ， 而 是 单独 的 一 
SCSI 磁盘 阵列 组 成 的 信息 孤岛 





























专门 连接 的 


这 样 ， 














SAN 通常 和 








扑 结构 比 NAS 的 网 络 结构 提供 更 快 更 可 
供 不 同 形式 的 光纤 通道 路 由 方案 ,为 SAN 架构 带 来 潜在 的 扩 


在 一 起 交换 数据 。 











储 器 的 过 程 。 
存储 的 逻辑 空 
Re 使 
络 上 集成 不 同 厂商 
1. FC-SAN 























光纤 通道 存储 区 域 网 络 (Fibre SD We Area Network，FC-SAN)， 是 目 衣 


个 存储 应 
统一 在 一 个 高 速 网 络 里 。 
SAN 提供 的 是 块 级 的 文件 存储 服务 ， 
一 个 孤岛 也 就 只 能 给 一 个 设备 来 
则 将 造成 所 有 数据 损坏 。 
光纤 来 连接 存储 设备 和 计算 机 ， 并 需要 在 计算 术 
[ 靠 的 存储 访问 速率 。 目 前 主流 SAN 设备 提供 商都 提 
展 性 ， 人 





的 是 厂商 专 
4 磁盘 阵列 ， 使 之 称 为 一 多 族人 的 存储 设备 

















使 用 ， 否 则 每 个 


SR 
| 


接 本 地 连接 在 服务 器 上 的 存储 设 
个 网 络 。 











随 着 技术 的 发 展 ， 提 出 了 存储 虚拟 化 ， 存 信康 氢化 是 指 将 办 理 存 清 吕 完全 4 
E it tie E 

， 并 且 透 明 的 操作 映射 实际 物理 位 置 的 过 程 : 它 是 由 每 个 最 近 4 
有 的 解决 方案 。 尽管 如 此 ， 虚拟 化 多 磁盘 阵列 
以 便于 对 其 进行 统一 














入 HBA 卡 。 





组 成 。 每 个 孤岛 都 是 


， 每 个 孤岛 也 就 是 一 个 虚拟 硬盘 (如 LUN)。 而 SAN 就 是 把 这 些 孤 岛 


因此 需要 使 用 该 存储 的 操作 系统 来 管理 文件 系统 。 
设备 对 该 孤岛 使 





用 不 同 的 文件 系统 ， 





光纤 拓 











同 的 光纤 网 可 以 整合 


象 为 逻辑 存 





此 来 创建 存储 器 > 这 样 可 以 给 








户 展现 数据 
: 产 的 磁盘 阵 
9 目的 是 在 网 
的 操作 。 











和 i 流行 的 使 


















































用 光纤 作为 拓扑 结构 的 存储 区 域 网 络 * 之 所 以 使 用 光纤 ,是 因为 光纤 可 以 提供 千 i 的 网 络 。 
光纤 通道 研究 始 于 1988 年 ,> 并 在 1994 年 发 布 第 二 个 ANSI 标准 。 之 后 持续 研发 ， 传 输 
速率 逐步 提高 ， 表 7-10 列 汕 了 近 几 年 的 光纤 如 EA 
A A 表 7-10 六 见 的 光纤 过 
名 称 人 速率 (GBaud) 流量 (MB/s) 开始 年 份 
1GFC 1.062 5 200 1997 
2GFC 2.125 400 2001 
4GFC 4.25 800 2005 
8GFC 8.5 1600 2008 
10GFC 串 行 10.52 2 550 2004 
10GFC 并 行 2 
16GFC 14.025 3 200 2011 
20GFC 21.04 5 100 暂 未 可 用 
使 用 SAN 的 计算 机 ， 必 须 有 HBA(Host Bus Adapter) 卡 ， 光 纤 连 接 到 HBA 卡 上 ， 再 适 配 
到 数据 传输 总 线 中 。 每 一 个 HBA 卡 都 有 一 个 唯一 的 全 球 识别 号 (World Wide Name，WWN)。 
WWN 类 似 于 以 太 网 卡 的 MAC 地 址 。 每 一 个 WWN 有 8 字 节 ， 每 一 个 HBA 卡 有 两 种 类 型 





WWN,， 一 个 是 节点 的 WWN， 另 一 个 是 端口 WWN。 


2. IP-SAN 





IP-SAN 是 指 基于 Internet Protocol 的 存储 区 域 网 络 。 其 中 使 用 了 iSCSI 标准 来 访问 存储 。 
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_iSCSI 是 Internet Small Computer System Interface 的 缩写 。 在 IP 网 络 中 传输 SCSI 命令 这 种 机 
加 刘 ， 使 得 在 局 域 网 内 传输 存储 数据 变 得 容易 。 理 论 上 iSCSI 可 以 用 来 在 局 域 网 、 城 际 网 、 互 
联网 上 传输 存储 数据 ， 存 储 设备 与 地 域 无 关 。 
iSCSI 由 IETF 提出， 并 于 2003 年 成 为 正式 标准 。 与 传统 的 SCSI 相 比 ，iSCSI 技术 有 以 
下 3 个 重大 变化 。 
(1) 把 原来 只 用 于 本 机 直接 连接 的 SCSI 命令 通过 TCP/IP 网 络 传送 ， 是 连接 距离 可 作 无 
限 扩 展 。 

(2) 连接 的 服务 器 数量 无 限 。 

(3) 由 于 使 服务 器 架构 ， 因 此 可 以 实现 在 线 扩容 及 动态 部 署 。 

以 下 有 几 个 名 词 是 iSCSI 里 经 常 提 及 的 ， 也 是 核心 的 概念 。 

1) Initiator _ 

一 个 Initiator 就 是 一 个 iSCSI 客户 端 。 它 通过 人 P 网 络 发 送 iSCSI 命令 给 服务 器 端 。 它 分 
为 软件 和 硬件 两 种 类 型 。 人 

2) Target AN 3 

在 iSCSI 描述 中 ，iSCSI 服务 器 上 的 一 个 存储 资源 就 是 一 个 Target。 通 常 是 一 个 与 网 络 连 
接 的 硬盘 存储 设备 。 一 个 iSCSI target 会 涉及 几 个 名 词 :- 存储 阵列 、 软 件 Target、 罗 辑 单元 号 
(Logical Unit Number，LUN)。 多 VN 

3) 地 址 《A NN” 

iSCSI Initiators 和 Targets 有 3 香江 

(1) iSCSI 有 效 名 称 (iSCSI Qualified Name, IQN), 是 在 REFC 3720 中 引入 的 。 它 由 4 部 分 
组 成 : iqn 字符 ; 命名 机 构 指 定 的 日 期 (格式 为 yyyy- RL 反 向 域名 :可 选 的 “; ”， 用 于 指明 
存储 target， 示 例如 下 。 入 Be 

iqn.2012-04.coni: éxample: storage: Sora 、 

iqn.2012- 04.com. VEXample 

iqn.2012- ojcami example:storage:tapel st .XYZ 

(2) 扩展 的 唯一 标志 符 (Extended Unique Identifier，EUD， 格 式 为 eui.{EUI-64 位 地 址 }， 
如 eui.02012567A324797A。 

(3) Tl1 网 络 地 址 权威 机 构 (T11 Network Address Authority，NAA)， 格 式 为 naa. {NASA 64 
位 或 128 位 标识 符 }， 如 naa.1234567AB12345A。 

3 种 格式 中 ， 以 IQN 地 址 格式 应 用 最 为 广泛 。 

IP-SAN 的 传输 速率 受 限于 网 络 带宽 ， 目 前 万 兆 网 络 已 经 成 熟 ， 因 此 IP-SAN 理论 上 可 以 
达到 10Gb/s 的 传输 速率 。 


7.3.4 ”RAID 技术 



























































独立 磁盘 元 余 阵列 (Redundant Array of Independent Disks, RAID) 简 称 磁盘 阵列 ， 是 把 多 个 
磁盘 合并 为 一 个 逻辑 单元 的 存储 技术 。 数 据 如 何在 多 个 磁盘 中 分 发 的 方式 称 为 RAID 级 别 ， 
主要 是 考虑 存储 元 余 性 和 性 能 处 于 哪个 级 别 。 
实际 上 RAID 是 存储 虚拟 化 的 一 个 例子 ,由 David Patterson、Garth A. Gibson 和 Randy Katz 
在 加 州 伯克利 大 学 在 1987 年 初次 定义 的 。 现 在 只 要 是 计算 机 数据 存储 ， 都 离 不 开 RAID。 下 
面 来 分 析 RAID 的 级 别 。 
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1) RAIDO RAIDO 
RAID 0 是 指 磁 盘 条 带 集 ， 内 容 平 均 分 布 在 各 个 磁盘 中 ， 没 有 元 余 校 验 ， 
如 图 7.8 所 示 。 它 最 大 的 优点 是 性 能 优化 。 理 论 上 ， 若 有 n 个 磁盘 ， 则 性 能 
是 单一 磁盘 的 性 能 乘 上 磁盘 数 ， 但 是 受制 于 IO 总 线 速度 ， 数 量 越 多 ， 性 能 
的 优势 会 随 着 边际 效应 减弱 ，2 个 磁盘 时 性 能 的 体现 最 明显 。 此 外 ， 磁 盘 的 
容量 不 受 影响 ， 即 磁盘 数 * 最 小 磁盘 容量 。 但 是 一 旦 其 中 一 个 磁盘 出 现 损坏 ， 




















则 所 有 数据 丢失 。 Disk0 Disk1 
最 少 所 需 磁盘 数 : 2 个 。 曾 寺 让 
2) RAID 1 





RAID 1 是 镜像 磁盘 ， 内 容 同时 写 入 两 个 磁盘 中 ， 由 此 产生 一 个 镜像 集 ， 如 图 7.9 所 示 。 
若 其 中 一 个 磁盘 损坏 ， 则 数据 可 以 在 另外 一 个 磁盘 中 找到 ， 其 读 性 能 在 合理 支持 下 可 以 是 磁盘 

















数 的 倍数 ， 但 是 写 性 能 没有 提升 也 没有 降低 。 ,从 oy 
存储 容量 以 磁盘 中 最 小 磁盘 容量 为 准 。 ,KK 
最 少 所 需 磁盘 数 : 2 个 。 \SN 
3) RAID 2 , 六 二 


RAID 2 作为 RAID 0 的 改良 版 ， 它 以 Hammin&Cede 的 方式 将 数据 进行 位 
级 别 编码 后 分 割 位 独立 的 位 元 ， 并 将 数据 分 别 写 闪 到 磁盘 中 ， 如 图 7.10 所 示 。 
由 于 数据 中 加 入 了 错误 修正 码 (Error Correction Code， ECC), 所 以 总 体 数 据 量 要 D0 DR 
比 原始 数据 量 大 。 MN 三 es 

由 于 其 性 能 不 能 确定 ， 以 及 共计 算 复 条 性 ， 现实 应 用 中 不 多 见 。 

最 少 所 需 磁盘 数 :3 个 。 3 YX 

4) RAID 3 XxX, 和 

字 节 级 别 的 带 校 验 的 条 带 化 。 数据 通过 编码 司机 分 别 存在 硬盘 中 ， 如 图 7.11 所 示 。 其 中 
的 校 验 码 独 立 写 在 一 个 硬盘 中 。 其 读 写 性 能 是 磁盘 数 的 一 1 倍 ， 但 是 写 入 时 需要 计算 ， 因 此 
性 能 要 低 于 读 性 能 

最 少 所 需 磁盘 数 ， 3 个 。 


RAID 2 RAID3 


图 7.9 RAID1 


WAT 


X 
人 











Disk0 Diskl Di 上 2 Disk3 Disk4 Disk$ Disk€ Disk0 Diskl! Disk2 Disk3 


图 7.10 RAID2 图 7.11 RAID3 
5) RAID 4 
RAID 4 与 RAID 5 类 似 ， 只 不 过 RAID 4 采用 的 块 级 校 验 ， 而 且 所 有 的 校 验 码 存储 于 一 
个 硬盘 上 ， 如 图 7.12 所 示 。 这 样本 应 提高 的 性 能 又 受制 于 最 后 校 验 码 写 入 的 硬盘 。 
最 少 所 需 磁盘 数 ，3 个 。 
6) RAID 5 
RAID 5 采用 的 是 块 级 分 布 式 校 验 码 条 带 集 。 它 把 校 验 码 分 布 式 的 放 在 各 个 盘 中 ,如 图 7.13 
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一 所 示 。 这 样 如 果 一 个 盘 出 现 损坏 ， 数 据 不 会 丢失 。 在 一 个 盘 损 坏 的 情况 ， 可 以 通过 计算 得 出 

















要 读 取 的 数据 。 但 是 读 取 性 能 会 下 降 。RAID5 是 一 种 存储 、 数 据 安全 和 存储 成 本 兼顾 的 存储 
解决 方案 。 

RAIDS 的 存储 容量 为 (n 一 1J*min(S1，S2，…*，S;)。 

最 少 所 需 磁盘 数 ， 3 个。 


RAID 4 





Disk0 Diskl Disk2 Disk3 Disgk 0 Disk 1 Disk2 Disk3 
图 7.12 RAID 4 ,图 7:13” RAID 5 
《XX\ 
7) RAID 6 , 


与 RAIDS 相 比 ，RAID6 增加 了 第 二 个 独立 的 奇偶 校 验 六 息 块 如 图 7.14 所 示 。 两 个 奇偶 
系统 相互 独立 ， 算 法 不 同 。 数 据 的 可 靠 性 即使 两 块 硬盘 出 现 故障 也 不 会 影响 数据 的 
使 用 。 但 是 RAID6 需要 为 奇偶 校 验 码 分 配 更 大 的 空间 ， 相 对 于 RAID5 来 说 有 一 定 的 写 性 能 
损失 。 、 

RAID6 的 存储 容量 为 (n 一 2)xmin( 

最 少 所 需 磁盘 数 : 4 个 。 7“、》 

8) RAID 10/01 Po 

RAID 10/01 细 分 为 RAID-1+0 或 者 RAID 0+l。 

RAID 1+0 是 先 镜像 再 条 带 化 如 图 7.15 所 示 > 具体 来 讲 是 把 所 有 硬盘 分 为 两 组 ， 每 组 内 
的 磁盘 按 RAID 镜 像 ， 两 组 之 间 按 RAID 0 条 带 化 。 这 样 ，RAID1+0 的 速度 提升 了 ， 而 且 拥 
有 比 RAID 0 更 可 靠 的 资料 安全 性 。 























ND 


,0 








RAID 1¢*0 
RAIDO 





Disk0 Disk1 Disk2 Disk3 Disk 4 DiskO Diskl Disk2 Disk3 
图 7.14 RAID6 图 7.15 RAID 1+0 





RAID 0+1 是 先 条 带 化 再 镜像 如 图 7.16 所 示 。 它 把 所 有 硬盘 分 成 两 组 ， 每 组 内 的 磁盘 先 
进行 条 带 化 ， 然 后 两 组 之 间 做 镜像 。 

RAID 0+1 比 RAID 1+0 有 着 更 快 的 读 写 速度 ， 但 是 也 多 了 出 问题 的 概率 ， 若 其 中 一 组 内 
的 所 有 硬盘 都 坏 掉 ， 则 整个 RAID 0+1 就 停止 工作 了 ， 而 RAID 1+0 则 可 以 在 没有 RAID 0 的 
优势 下 正常 工作 。 
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无 论 是 RAID 1+0 还 是 RAID 0+1, 都 至 少 需 要 4 个 磁盘 ， 


RaID O01 
且 容 量 至 少 减 半 。 RAID1 


9) RAID 50 

RAID 50 也 成 为 镜像 阵列 条 带 集 ， 由 至 少 6 块 硬盘 组 成 ， 
像 RAID 0 一 样 ， 数 据 被 分 割 成 条 带 化 ， 同 一 时 间 在 多 块 磁盘 
上 写 入 ; 也 像 RAID 5 一 样 ， 以 数据 校 验 位 的 方式 来 保证 数据 
的 安全 , 且 校 验 数据 均匀 的 分 布 在 各 个 磁盘 上 。 其 目的 在 于 提 
高 RAID5 的 读 写 性 能 。 

实际 应 用 中 ，RAID 2、RAID 3、RAID 4 几乎 用 的 不 多 ， 
因为 RAID5 涵盖 了 所 需 的 功能 。 实 际 中 以 RAID 1、RAID 5、 
RAID 6、RAID 10、RAID 50 应 用 的 较 多 。 





























图 7.16 RAID 0+1 


,人 

7.4 文件 系 3 \ 

文件 系统 (File System) 是 指 存储 设备 中 组 织 、 et 它 还 负责 管理 存 
储 设备 上 可 用 空间 。 2 

文件 系统 是 一 种 用 于 向 用 户 提供 底层 数据 访问 的 机 制 ， 它 将 设备 中 的 空间 划分 为 特定 大 

小 的 块 ( 扇 区 )， 每 种 文件 系统 的 块 小 在 Se 数据 存在 这 些 块 中 ， 由 文件 系统 负责 将 这 些 块 

组 织 为 目录 和 文件 ， 并 记录 哪些 块 分 给 哪个 文件 ， 以 及 些 块 没有 被 使 用 。 


实际 上 文件 系统 也 可 能 是 一 种 数据 访问 接口 ， 如 NES、SMB 及 9P 等 网 络 协议 或 者 在 内 
存 中 的 数据 ， 并 不 直接 面 对 具 体 的 设备 而 是 -各 访问 接口， 


文件 和 目录 < A 


全 

文件 系统 家 是 以 日 录 和 文件 的 形式 来 组 织 数据 的 。 文件 系统 一 般 会 把 文件 名 链接 到 某 种 
文件 分 配 表 中 ， 或 者 链接 到 一 个 文件 链表 的 节点 上 。 目 录 可 以 是 平面 结构 ， 也 可 以 是 分 层 结 
构 ， 后 者 可 以 在 目录 中 创建 目录 。 有 的 文件 系统 中 ， 文 件 名 是 结构 化 的 ， 带 有 文件 名 扩展 信 
息 及 版 本 号 ; 而 有 些 文件 系统 里 ,文件 名 仅仅 是 一 个 字符 串 ， 每 个 文件 的 属性 信息 另外 保存 。 

2. 元 数据 

文件 相关 的 信息 一 般 跟 文件 一 起 保存 在 文件 系统 中 。 文 件 长 度 是 分 配给 这 个 文件 的 区 块 
书 ， 也 可 能 是 这 个 文件 实际 的 字 节 数 。 文 件 最 后 修改 时 间 也 可 能 记录 在 文件 的 时 间 属 性 中 。 
有 的 文件 系统 还 记录 文件 的 创建 时 间 和 修改 时 间 ， 以 及 最 后 访问 时 间 。 其 他 涉及 文件 所 有 者 、 
组 及 访问 权限 的 信息 也 有 可 能 保存 在 文件 系统 中 。 






































3. 安全 访问 

针对 文件 系统 操作 的 安全 访问 可 以 通过 访问 控制 列表 (ACL) 或 者 capabilities 来 实现 。 但 是 
示 运 用 中 , 单 靠 ACL 难以 保证 数据 安全 ,因此 部 分 研发 中 的 文件 系统 倾向 于 采用 capabilities。 
下 面 就 常见 的 几 种 文件 系统 做 一 说 明 。 
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一 多 若 你 度 林 及 站 应 用 (第 二 县) 


oe 
7.4.1 FAT/FAT32 


文件 分 配 表 (File Allocation Table，FAT)， 是 Microsoft 发 明 并 拥有 部 分 专利 的 文件 系统 ， 
在 Microsoft 的 MS-DOS、Windows 操作 系统 中 使 用 。 

FAT 的 优点 是 简单 ， 所 以 几乎 所 有 个 人 计算 机 的 操作 系统 都 支持 ， 前 述 的 移动 存储 卡 和 
移动 存储 设备 都 支持 该 文件 系统 ， 比 较 适 合 在 多 个 操作 系统 中 进行 数据 交换 。 

FAT 的 缺点 有 以 下 几 点 。 

(D 没有 权限 信息 。 pos td een ni 用 户 可 以 修改 、 删 除 、 读 取 。 

(2) 文件 删除 后 ，FAT 不 会 将 文件 整理 在 一 起 写 入 ， 而 是 分 散在 磁盘 上 可 用 空间 内 ， 这 样 
长 时 间 操 作 后 ， 磁 盘 上 的 文件 将 变 得 非常 分 散 凌乱 ， 人 E 下 降 ， 因 此 出 现 了 磁盘 碎 
片 整理 工具 。 

(3) FAT 文件 系统 没有 事务 性 。 若 文件 正在 写 入 时 断 电 ， 则 有 可 能 文件 前 后 不 一 致 。 

(4) 文件 分 配 表 的 脆弱 性 。 所 有 文件 都 是 靠 文件 分 配 表 进行 索引 管理 。 若 正在 修改 文件 分 
配 表 时 断 电 ， 则 整个 硬盘 数据 有 可 能 变 得 无 序 ， EY 5 

此 外 ，FAT 之 后 一 般 跟 一 个 数字 ， 如 FAT12， my 32。 其 后 的 数字 是 指 簇 寻 址 的 
位 数 , 这 个 数字 限制 了 文件 的 大 小 , 如 最 高 的 FAT32; 最 大 长 度 为 4GB, 因为 232~4GB。 
超过 该 大 小 的 文件 无 法 保存 ， 对 于 目前 流行 的 高 清 影 片 米 说 这 是 个 阴 碍 。 

FAT 的 文件 名 长 度 也 不 是 统一 的 。 A 时 期 ， 文 件 名 最 大 长 度 只 有 11 个 字符 ，8 个 
字符 的 主 文件 名 , 3 个 字符 的 扩 展 文件 锥 进入 indows 95 后 , 文件 名 开始 扩展 到 255 个 字符 。 









































7.4.2 exFAT 和 > XDA 


扩展 的 文件 分 配 表 系统 (Extended File Allocation Table; Guir， 又 称 FAT64) 是 一 种 特别 适合 闪 
存盘 的 文件 系统 ， 最 先 从 Microsoft 的 Windows Embedded CE 6.0 中 启用 ， 后 来 在 Windows XP SP3 
以 上 , Windows Vista' SP 以 后 的 操作 系统 中 加 六 支持 , Apple 的 MAC OS X 也 支持 该 文件 系统 。 

相 比 于 之 前 的 FAT 文件 系统 ，exFAT 县 有 以 下 几 点 。 

(1) 瑟 扩展 容 更 大 磁盘 空 5 间 ， 从 FAT32 的 32GB 扩展 到 256TB 。 

(2) 理论 上 文件 大 小 限制 为 24 字 节 ，FAT32 只 有 232 字 节 。 

(3) 簇 大 小 可 以 达到 32MiB 。 

(4) 可 用 空间 和 删除 性 能 得 到 了 提升 。 

支持 访问 控制 列表 及 其 他 一 些 特性 。 

但 是 由 于 exFAT 是 后 来 的 文件 系统 ， 某 些 设备 及 操作 系统 对 它 不 支持 ， 以 及 Microsoft 
给 出 的 授权 不 明确 ， 因 此 限制 了 exFAT 的 使 用 。 












































7.43 NTFS 














NTFS(New Technology File System) 是 Windows NT 及 之 后 的 NT 系列 操作 系统 使 用 的 标准 文 
件 系统 ， 如 Windows 2000、Windows XP、Windows Vista、Windows 7 及 最 新 的 Windows 2008 和 
Windows 8 系统 。 

NTFS 对 FAT 和 HPFS( 高 性 能 文件 系统 ) 作 了 若干 改进 ， 支 持 元 数据 ， 并 且 使 用 了 高 级 数 
据 结构 ， 改 善 了 性 能 及 磁盘 空间 利用 率 ， 支 持 访问 控制 列表 和 文件 系统 日 志 ， 并 支持 事务 性 。 
有 具体 来 说 其 具有 以 下 特点 和 功能 
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1. NTFS 日 志 

NTFS 日 志 是 一 个 非常 关键 的 功能 ,用 于 确保 内 部 的 复杂 数据 结构 和 索引 即使 在 系统 发 生 
衣 溃 后 仍然 能 够 保持 一 致 ， 并 在 卷 被 重新 加 载 后 能 够 方便 地 对 这 些 关 键 数据 结构 的 失败 提交 
进行 回 滚 。 
2. USN 日 志 
USN 日 志 (更 新 序列 数 日 志 ) 是 一 项 系统 管理 功能 ， 用 于 记录 卷 中 所 有 文件 、 数 据 流 、 目 
录 的 内 容 、 各 项 属性 及 安全 设置 的 更 改 情况 。 应 用 程序 可 以 利用 日 志 追 踪 卷 的 更 改 ， 如 著名 
的 Everything 软件 就 是 通过 USN 来 快速 查找 文件 。 

3， 硬 链接 和 短文 件 名 

硬 链 接 原本 用 于 支持 Windows NT 的 POSIX 子 系 统 ， 该 功能 i 不 过 作 
目标 是 文件 而 不 是 目录 。 硬 链接 只 能 作用 于 同一 个 卷 的 文件 , 它 需 要 在 文件 的 MTF 记录 中 增 









































加 一 个 额外 的 文件 名 记录 。 短 文件 名 (8.3 格式 ) 也 同样 使 件 明 来 实现 ， 以 便于 同步 更 
新 。 当 更 改 文件 的 尺寸 或 者 属性 时 ， 不 会 立即 更 新 对 应 的 且 录 和 链接 ， 只 有 打开 的 时 候 才能 
体现 相应 的 变化 。 KW 

4. 可 选 数据 流 "XK 


ol 


选 数据 流 (ADS) 使 得 一 个 文件 可 以 同时 和 多 个 数据 流 相关 联 。 数据 流 的 表示 方式 为 “ 文 
件 名 : 数据 流 名 称 ” 如 “my.txt:streaim ”数据 流 不 会 显示 在 资源 管理 器 中 ， 查 看 文件 大 小 时 
它们 的 大 小 也 不 包含 在 内 。 如 果 将 交大 日 到 其 他 不 支持 据 流 的 文件 系统 中 时 ， 这 些 
可 选 数 据 流 将 不 被 复制 ， 因 上 虹 不 能 用 来 保存 重要 数据 2 ~ 

需要 注意 的 是 ， 有 些 肝 意 软 件 可 能 会 在 该 数 流 引 隐藏 程 序 代码 。 Internet Explorer 下 载 
文件 时 ， 也 会 在 其 中 添加 一 个 非常 小 的 可 选 数据 流 ” 用 来 记录 从 哪里 下 载 的 。 因 此 在 打开 这 





% 
5.， 磁 盘 空间 限额 

磁盘 空间 限额 是 方便 管理 员 为 用 户 设置 允许 占用 的 磁盘 空间 设置 一 个 阐 值 ， 防 止 用 户 无 
限制 的 占用 磁盘 空间 资源 。 

6.， 卷 加 载 点 

类 似 于 UNIX 的 加 载 点 ， 是 另 一 个 文件 系统 附加 到 目录 的 根 位置 。 在 NTFS 中 ， 该 功能 
允许 加 载 一 个 驱动 器 到 加 载 点 而 无 须 分 配 单独 的 盘 符 。 

被 加 载 的 卷 可 以 使 用 非 NTFS 文件 系统 ， 如 把 一 个 远程 共享 的 目录 加 载 到 当前 目录 。 

7. 目录 连接 和 符合 链接 

目录 连接 类 似 于 卷 加 载 点 ， 但 目录 连接 是 将 对 象 连接 到 文件 系统 中 的 其 他 目录 而 非 卷 。 
例如 ， 目 录 C:example 带 有 一 个 目录 连接 属性 ， 链 接 到 Di:\linkedexample 目录 。 有 目录 连 接 可 
以 通过 命令 提示 符 中 的 MKLINK /命令 来 建立 ， 它 是 永久 性 的 。 

符号 链接 (又 称 软 链接 ) 可 以 链接 到 文件 ， 也 可 以 链接 到 目录 ， 也 是 通过 MKLINK 命令 建 
立 的 。 符 号 链接 可 以 引用 远程 服务 器 上 的 共享 文件 夹 或 其 中 的 文件 。 符 号 链接 可 以 在 NTFS 
上 永久 保留 。 
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一 8.， 卷 影 复 制 
卷 影 复制 (Volume Shadow Copy) 服 务 通过 将 新 改写 的 数据 复制 到 卷 影 来 保存 NTFS 卷 上 
的 文件 和 文件 夹 的 历史 版 本 。 当 用 户 请 求 恢复 假 造 版 本 时 ， 旧 的 文件 数据 会 覆盖 新 的 文件 数 
据 。 该 功能 也 为 数据 备份 程序 可 以 存档 当前 系统 正在 使 用 的 文件 。 
9. 文件 压缩 
NTEFS 压缩 文件 使 用 多 种 LZ77 算法 。 压 缩 文 件 适用 于 甚 少 写 入 、 平 常 顺序 访问 、 本 身 没 
有 被 压缩 过 的 文件 。 不 适用 于 压缩 图 片 文件 、 程 序 文件 和 小 于 4KB 的 文件 ， 对 于 引导 系统 分 
区 也 不 要 压缩 。 


10， 加 密 文件 系统 


加 密 文件 系统 (EFS) 提 供 对 NTFS ee ed nat 加 密 文件 系 
统 与 EFS 服务 、Microsoft 的 加 密 应 用 程序 接口 (Cryptography API 或 称 'cryptoAPD 及 EFS 文件 
运行 时 库 (FSRTL) 联 合 工作 。EFS 使 用 块 对 称 密 钥 加 密 文人 对 在 加 

密 和 解密 大 量 数据 是 消耗 的 时 间 较 少 。 该 对 称 密 钥 使 全 加 密 文件 的 用 户 相关 的 公 钥 加 
密 文件 ， 加 密 后 的 数据 储存 在 被 加 密 文件 的 ry 当 需 要 解密 文件 时 ， 文 件 系 统 使 
用 用 户 的 密 钥 解密 储存 在 文件 头 中 的 对 称 密 然后 使 用 该 对 称 密 钥 解密 文件 。 这 些 操作 在 
文件 系统 级 别 完成 ， 因 此 对 用 户 来 说 是 < 


.事务 NTFS SS 


在 Windows Vista 中 ， 应 用 程序 宁 以 使 用 事务 Room NTFS) 将 一 系列 对 文件 
的 更 改 归 组 到 一 个 事务 中 。 可 机 人 所 用例 时 生效 ， 要 么 同时 作废 ， 并 能 确保 
在 事务 提交 完成 前 ， 外 部 应 用 程序 无 法 获知 任何 

该 技术 使 有 Pe 以 确保 被 改写 的 数据 可 以 安全 地 回 深 ， 通 用 日 志文 
件 系 统 的 日 志 将 记录 下 尚未 成 功 提交 或 者 已 经 提交 但 尚未 完全 生效 的 事务 ， 通常 情况 下 这 是 
因为 事务 的 某 个 3 者 在 提交 过 程 中 系统 意外 崩溃 引起 的 。 

除了 以 上 特性 , NTFS 还 提供 其 他 特性 , 如 本 机 结构 存储 、 单 实例 存储 、 分 层 存储 管理 等 。 

Microsoft 认为 该 文件 系统 的 详细 定义 属于 商业 机 密 ， 并 注册 为 知识 产权 产品 ， 因 此 其 他 
厂商 对 该 文件 系统 的 支持 有 限 。 





































































































7.5 云 存储 


云 存储 是 与 云 计算 同时 兴起 的 一 个 概念 ， 实 际 上 云 计算 需要 云 存储 技术 的 支持 。 云 存储 
一 般 包 含 以 下 两 种 含义 。 

(1) 云 存储 是 云 计 算 的 存储 部 分 即 虚拟 化 的 、 易 于 扩展 的 存储 资源 池 。 用 户 通 过 云 计算 
使 用 存储 资源 池 ， 但 不 是 所 有 的 云 计算 的 存储 部 分 都 是 可 以 分 离 的 。 

(2) 云 存储 意味 着 存储 可 以 作为 一 种 服务 , 通过 网 络 提供 给 用 户 。 用 户 可 以 通过 若干 种 方 
式 来 使 用 存储 ， 并 按 使 用 (时 间 、 空 间或 两 者 结合 ) 付 费 。 

云 存储 的 服务 方式 有 以 下 多 种 。 

(1) 通过 互联 网 开放 接口 (如 REST)， 使 得 第 三 方 网 站 可 以 通过 云 存储 提供 的 服务 为 用 户 
提供 完整 的 Web 服务 。 
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(2) 用 户 直接 使 用 存储 相关 的 在 线 服 务 ， 如 网 络 硬盘 、 在 线 存 储 、 在 线 备份 及 在 线 归档 等 
服务 。 
(3) 用 户 传送 文件 、 或 者 服务 商 发 布 内 容 时 的 缓冲 。 























7.5.1 Apple 公司 的 iCloud 


iCloud 是 Apple 公司 所 提供 的 云端 服务 ， 使 用 者 可 以 免费 储存 5GB 的 资料 。 

2011 年 5 月 31 日 Apple 官方 首次 宣称 有 iCloud 的 产品 。iCloud 是 基于 原 有 的 MobileMe 
功能 全 新 改写 而 成 ， 提 供 了 原 有 的 邮件 、iCal 日 历 、 联 络 人 同步 功能 及 工作 文档 同步 。2011 年 6 
月 6 日 Apple 公司 执行 长 Steve Jobs 主持 全 球 开发 商 大 会 (WWDOC), 正式 发 表 云端 服务 iCloud， 
iOS 5 及 OS X Lion. 中 开始 提供 iCloud 服务 。 









































7.5.2 Amazon S3 
































Amazon S3 (Amazon Simple Storage Service, 亚马逊 简易 人 ca Amazon 公司 , 利用 公 
司 网 络 服务 系统 所 提供 的 网 络 线 上 储存 服务 。 经 由 Web 服务 办 ， 包 括 REST 接口 ，SOAP 接 
口 及 比特 流 ， 为 用 户 提供 能 够 简易 把 文件 储存 到 网 络 服务 器 士 的 方案 。 从 2006 年 3 月 开始 , 亚 
马 逊 公司 在 美国 推出 这 项 服务 ，2007 年 11 月 扩展 到 欧洲 地 区 。 Amazon S3 是 收费 服务 的 。 











7.5.3 Microsoft Windows Azure - 人 
At 


Windows Azure 是 由 Microsoft i 发 展 的 二 套 云 计算 操作 系统 ， 用 来 提供 云 线 上 服务 所 需 














Microsoft 线 上 服务 策略 的 - -部 分 3 WA ” 

Windows Azure( 及 Azure 服务 平台 ) 由 Mic soft 省 席 软件 架构 师 Ray Ozzie 在 2008 年 
Microsoft 年 度 的 专业 开发 人 员 大 会 中 发 表 , ; 彰 末 2010 年 2 月 正式 开始 商业 运转 。 

Windows Apuie 提供 了 3 种 不 同 格式 的 存储 服务 ， 为 在 Windows Azure 上 运行 的 应 用 系统 
提供 存储 服务 不 是 哪 一 种 存储 服务 , Windows Azure 都 有 REST API, 并 符合 Simple Cloud 
的 标准 。 








7.6 总 结 


本 章 主 要 介绍 多 媒体 存储 技术 相关 的 内 容 。 随 着 技术 的 发 展 ， 存 储 技术 无 论 是 介质 、 容 
量 、 技 术 都 突飞猛进 。 存 储 容量 从 原来 的 数 MB， 到 现在 的 TB: 存储 介质 从 普通 的 CD 到 现 
在 的 BD; 存储 方式 从 原来 的 物理 硬盘 从 现在 企业 级 别 的 网 络 存 储 及 虚拟 存储 ; 针对 便携 式 数 
码 产品 ， 出 现 了 速率 高 ， 容 量 大 的 多 种 存储 卡 。 最 后 为 了 跟随 网 络 的 发 展 ， 存 储 不 青 是 在 本 
地 ， 而 是 采用 云 存 储 的 方式 ， 可 以 随时 随地 存储 访问 信息 。 




















7.7 习 题 


1. 填空 题 
(1) 光盘 存储 介质 的 发 展 ， 主 要 经 历 了 、 、 和 阶段 。 
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-一 (2) 一 张 普通 CD 的 容量 有 MB， 或 者 700MB。 
(3) 一 张 普通 D9 格式 的 DVD， 其 容量 是 GB， 是 D5 格式 的 DVD 的 容量 
的 倍 。 
(4) 目前 流行 的 蓝光 光盘 的 最 高 容量 是 GB。 
(5) 常见 的 存储 卡 有 S 站 和 
(6) 移动 硬盘 与 计算 机 相连 接 的 接口 主要 有 、FireWire。 
(7) 网 络 存储 有 . -SAN 和 -SAN 两 种 方式 。 














(8) 常用 的 文件 系统 有 、 
(9) FAT32 文件 系统 中 的 文件 最 大 为 


2. 判断 题 














_ 和 NTFS 文 件 系统 。 


GB. 


(1) RAID1 是 镜像 卷 ， 其 中 一 个 硬盘 坏 掉 数据 不 会 丢失 。 








(2) BD 允许 双 面 双 层 存储 。 








(3) NAS 存储 和 SAN 存储 都 是 提供 块 级 存储 。 
(4) IP-SAN 和 FC-SAN 都 可 以 提供 10GB 的 传输 速率 。 


;站 
《A \\ 


(5) NTFS 文件 系统 具有 文件 加 密 的 功能 。 
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教学 提示 


> 虚拟 现实 技术 是 多 媒体 技术 发 展 的 更 高 境界 , 汇集 了 计算 机 图 形 学 
多 媒体 技术 、 人 工 智 能 、, 闪 机 接口 技术 、 传 感 器 技术 、 高 度 并 行 的 
实时 计算 技术 和 全 的 行为 学 研究 等 多 项 关键 技术 。 它 以 其 巨大 的 技 
术 潜 力 、 诱 入 的 应 用 前 景 ,一 经 问世 就 受到 人 们 的 高 度 重视 。 然 而 ， 
由 于 各 种 条 忻 限制 ， 虚 拟 现实 技术 尚 处 在 婴儿 时 期 ， 还 存在 着 很 多 
尚未 解决 的 理论 问题 和 尚未 克服 的 技术 障碍 

教学 目标 

Le 

> 本 章 主要 介绍 虚拟 现实 技术 的 潜在 内 涵 、 主 要 特点 及 目前 所 涉及 的 
关键 技术 。 通 过 本 章 的 学 习 ， 要 求 掌握 虚拟 现实 的 定义 、 虚 拟 现 实 
的 主要 特点 、 虚 拟 现实 系统 的 分 类 及 组 成 、 虚 拟 现实 技术 的 研究 内 
容 及 应 用 领域 、 虚 拟 现实 建 模 语言 VRML 的 初步 使 用 。 
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8.1 ”虚拟 现实 技术 概述 





从 远古 时 代 跨 越 时 空 的 故事 到 科学 幻想 小 说 ， 葛 定 了 虚拟 现实 的 思想 基础 ， 而 近代 电子 
学 、 计 算 机 等 科学 为 实现 这 种 幻想 提供 了 硬件 和 硬件 环境 。 虚 拟 现 实 的 研究 对 多 媒体 技术 提 
出 了 更 高 的 要 求 ,美国 著名 计算 机 图 形 学 专家 JFoley 曾 指出 : 虚拟 现实 或 许 是 人 机 交互 接口 
作为 计算 机 设计 的 最 后 一 个 堡垒 中 最 有 意义 的 领域 。 


8.1.1 虚拟 现实 的 定义 


信息 技术 的 发 展 促使 人 们 为 了 适应 未 来 信息 社会 的 需要 ， 必 须 提 高 与 社会 的 接口 能 
力 ， 提 高 对 信息 的 理解 能 力 。 人 们 不 仅 希望 能 通过 打印 输出 或 显示 屏幕 的 窗口 ， 在 外 部 观察 
信息 处 理 的 结果 ， 而 且 还 希望 能 通过 视觉 、 听 觉 、 触 觉 、 味 觉 及 形体 动作 等 参与 到 信息 处 理 
的 环境 中 去 ， 获 得 身 临 其 境 的 体验 。 这 种 信息 处 理 方法 已 不 仅仅 要 求 建 立 一 个 一 维 的 数字 化 
信息 空间 ， 更 需要 建立 一 个 多 维 化 的 信息 空间 ， 一 个 感性 认识 和 理性 认识 相 结 合 的 综合 集成 
环境 ， 而 虚拟 现实 技术 将 是 支撑 这 个 多 维 信息 空间 的 关键 
技术 ， 如 图 8.1 所 示 。 

虚拟 现实 六 词 来 源 于 英文 单词 “Virtual Reality”， 也 可 
以 翻译 为 “ 灵 境 ”"、“ 临 境 "“ 幻 真 ”等 , 最 早 由 VPL Research 
公司 的 黄 基 人 Jaron Lanieri 于 1989 年 在 有 关 的 杂志 报刊 上 
使 用 ， 意 指 “计算 机 产生 的 三 维 交 境 ， 在 使 用 中 用 户 
“投入 ”到 这 个 环境 中 去 的 ”。 根 据 这 种 理解 ， 虚 拟 现实 的 
一 种 定义 是 ， 虚拟 现实 就 是 让 用 户 在 人 工 合成 的 环境 里 获 
得 “进入 角色 ”的 体验 ,而 Francis Hamit 在 Virtual Reality and 
the Exploration of Cyberspace 中 给 这 个 词 下 了 男 外 一 种 定 
义 :“ 一 种 依赖 于 空间 成 像 及 在 计算 机 生成 环境 中 形成 错觉 
的 人 机 界面 . ”Ken Pimentel 和 Kevin Teixeira 在 Virtual 
Reality-Through the New Looking Glass 中 给 出 的 定义 则 是 
在 其 中 用 户 有 一 种 身 
:者 对 虚拟 现实 也 
有 自己 的 理解 :“ 所 谓 虚 拟 现实 是 指 用 计算 机 技术 生成 的 一 个 允 真 的 视觉 、 听 觉 、 触 觉 及 嗅觉 
等 的 感觉 世界 ， 用户 可 以 用 人 的 自然 技能 对 这 个 生成 的 虚拟 实体 进行 交互 考察 .” 虚 拟 现实 的 
定义 可 以 说 是 众说 纷 绒 ， 但 无 论 其 定义 如 何 ,“ 虚 拟 现实 ”这 个 概念 包括 了 3 层 含 义 。 

(1) 虚拟 实体 是 用 计算 机 来 生成 的 一 个 逼真 的 实体 ,“ 通 真 ”就 是 要 达到 三 维 视觉 ， 甚 至 
包括 三 维 的 听觉 及 嗅觉 等 。 

(2) 用 户 可 以 通过 人 的 自然 技能 与 这 个 环境 交互 ， 这 里 的 自然 技能 可 以 是 人 的 头 部 转动 、 
眼 动 、 手 势 或 其 他 的 身体 动作 。 

(3) 虚拟 现实 往往 要 借助 一 些 三 维 传 感 设备 来 完成 交互 动作 , 常用 的 有 数据 手套 (如 图 8.2 
所 示 )、 头 盔 式 立体 显示 器 HMD( 如 图 8.3 所 示 )、 数 据 衣 、 三 维 鼠 标 、 立 体 声 耳 机 等 。 



























































图 8.1 虚拟 现实 技术 示意 图 


“至 少 需 要 一 副 虚 拟 现实 眼镜 和 一 台 计算 机 来 创建 一 个 三 维 的 人 工 环境 ， 
临 其 境 的 感觉 ， 用 户 能 到 处 观看 、 移 动 ， 确 实感 到 身 临 其 境 。” 国 内 的 专 
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8.1.2 ”虚拟 现实 的 发 展 





多 = 站 三 


8.2 ”数据 手套 图 8.3 头盔 式 立体 显示 器 HMD 


1965 年 ,计算 机 图 形 学 创始 人 Ivan Sutherland 在 IFIP 会 议 上 做 了 题 为 The Uelimate Display 
的 报告 。 该 报告 中 首次 提出 了 包括 具有 力 反 馈 设备 、 交互 图 形 显示 及 上 声音 示 的 虚拟 现实 系 


统 的 基本 思想 。 自 此 人 们 开 











1966 年 ， 美 国 麻 省 理 








台 对 虚拟 现实 系统 的 研究 与 逝 
-学 院 的 林肯 实验 室 正式 开始 了 浴 盔 式 显示 器 的 研制 工作 。 在 第 一 








个 头盔 式 立体 显示 器 的 样 
个 系统 中 。 


Videoplace 的 “并 非 存在 的 
到 了 20 世纪 80 年 代 s% 


完成 不 久 ， 研 制 者 又 把 能 模拟 力量 和 触觉 的 力 反馈 装置 加 入 到 这 


970 年 ，Ivan Sutherland 经 过 了 一 系列 的 努力 ， 在 犹他 州 大 学 终于 研制 成 功 了 第 一 个 功 
能 较 齐 全 的 头盔 式 立体 显示 器 (HMD) 系 统 
1975 年 ，Myron Krueger ;提出 “人 工 现实 ”(Artifieal`~Reality) 的 思想 ， 并 展示 了 名 为 


一 种 概念 化 环境 "。 7 
随 关 信息 技术 的 飞速 发 展 X 特别 是 图 形 显示 技术 取得 的 一 系列 的 





成 就 ， 虚 拟 现 实 技术 又 取得 了 惊人 的 进展 。 测 现 了 VIVED HMD、Data Glove 等 一 系列 成 果 。 
而 美国 国家 航空 航天 局 (NASA) 及 美国 国防 部 组 织 的 一 系列 有 关 虚 拟 现实 技术 的 研究 , 更 引起 





了 人 们 对 虚拟 现实 技术 的 广 
进入 20 世纪 90 年 代 ， 


计 不 断 创新 ， 新 颖 、 实 用 的 输入 /输出 设备 不 断 进入 市 场 。 基 于 大 型 数据 集合 的 声 


- 泛 关注 。 而 在 此 时 ,“ 虚 拟 现实 ”(Virtual Reality) 一 词 也 应 运 而 生 。 
计算 机 硬件 技术 与 软件 系统 的 迅速 发 展 ， 使 得 人 机 交互 系统 的 设 
音 和 图 像 的 











实时 动画 制作 成 为 可 能 。 而 这 些 都 为 虚拟 现实 系统 的 发 展 打 下 了 良好 的 基础 。1990 年 ， 在 美 





























月 , 宇航 员 和 和 


















































达拉斯 召开 的 Siggraph 会 议 上 明确 提出 虚拟 现实 技术 的 主要 内 容 是 : 实时 三 维 图 形 生成 技 
术 、 多 传感器 交互 技术 及 高 分 辨 率 显 示 技 术 ， 更 为 虚拟 现实 技术 的 发 展 确定 了 研究 方向 。 

此 后 ， 各 个 国家 对 虚拟 现实 的 研究 更 加 重视 ， 并 将 其 广泛 运用 到 各 个 领域 。 例 如 ，1993 
用 虚拟 现实 系统 成 功 地 完成 了 从 航天 飞机 的 运输 舱 内 取出 新 的 望远镜 面板 
的 工作 。 而 用 虚拟 现实 技术 设计 波音 777 获得 成 功 ， 是 近年 来 引起 科技 界 瞩 目的 又 一 件 工作 。 
正 是 因为 虚拟 现实 系统 的 广泛 应 用 ， 如 娱乐 、 军 事 、 航 天 、 设 计 、 生 产 制 造 、 信 息 管 理 、 商 





























贸 、 建 筑 、 医 疗 保险 、 和 危险 及 恶劣 环境 中 工作 的 遥 操 作 、 教 育 与 培训 、 信 息 可 视 化 ， 以 及 远 
程 通信 等 ， 人 们 对 迅速 发 展 中 的 虚拟 现实 系统 的 广阔 应 用 前 景 充满 了 异 慢 与 兴趣 。 





8.1.3 ”虚拟 现实 的 研究 现状 





北 卡罗来纳 大 学 教堂 ! 




















1 分 校 (UNC) 的 计算 机 系 是 进行 虚拟 现实 研究 最 早 最 著名 的 大 学 。 








他 们 主要 从 事 分 子 建 模 、 航 空 驾驶 、 外 科 手 术 仿真 、 建 筑 仿真 等 。 
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“六 订 接 术 及 其 用 (第 之 入) 
麻 省 理工 学 院 (MIT) 的 研究 一 直 走 在 最 新 技术 前 沿 。1985 年 ，MIT 成 立 了 媒体 实验 室 ， 


并 进行 了 虚拟 环境 的 正规 研究 , 并 取得 了 BOLIO 测试 环境 、 对 象 运动 跟踪 动态 系统 等 一 系列 


的 成 果 。 








美国 的 洛 玛 琳 达 (Loma Linda) 大 学 医学 中 心 是 一 所 经 常 从 事 高 难度 或 者 有 争议 课题 的 
医学 研究 单位 。 该 研究 中 心 的 David Warner 博士 和 他 的 研究 小 组 成 功 地 将 虚拟 现实 技术 用 于 











探讨 与 神经 疾病 有 关 的 问题 。 

















华盛顿 大 学 华盛顿 技术 中 心 的 人 机 界面 技术 实验 室 (HIT Lab) 领 导 了 新 概念 的 研究 。 它 将 
虚拟 现实 研究 引入 到 了 工程 设计 、 教 育 娱乐 和 制造 领域 等 多 个 领域 ， 在 感觉 、 知 觉 、 认 知 和 








运动 控制 能 力 方面 做 了 大 量 的 研究 工作 。 





























NASA Ames 实验 室 将 研究 重点 放 在 对 空间 站 操纵 的 实时 仿真 上 , 他 们 大 量 运 用 了 面向 座 
舱 的 飞行 模拟 技术 。NASA 完成 的 一 项 著名 的 工作 是 对 哈 勃 望远镜 的 仿真 。 现 在 NASA 已 经 


建立 了 航空 、 卫 星 维护 虚拟 现实 系统 、 a ei eg 
伊利 诺 伊 州立 大 学 





























系统 ， 不 同 国家 、 地 








ee 





区 的 工程 师 可 以 通过 计算 机 网 络 实时 协作 进行 设计 。 


主要 是 娱乐 业 方 面 的 。 

















此 外 ， 美 国 的 乔治 梅森 大 学 nn 公司 和 ARRL 有 限 公司 、 
研究 组 织 (INO) 的 物理 与 电 ori 


WIndustries 位 于 Leicester， 是 国际 VR Ts ， 正 在 开发 一 系列 VR 产品 ， 














荷兰 应 用 科学 
验 室 、 京 都 先 











东京 技术 学 院 精密 和 智能 实 


进 电子 通信 研究 所 (ATR)、 Tk 研究 中 心 等 也 分 别 对 虚拟 现实 进行 了 深入 的 研 
究 ， 取 得 了 一 系列 的 成 果 。 。 ， XXX 














Ts Pn 而 且 已 经 实现 或 


正在 研制 的 虚拟 现实 系统 也 有 不 少 。 





k 京 航空 航天 大 学 计算 机 系 是 国内 较 时 wu 极 具 权 威 的 单位 之 一 ， 主 要 从 事 














虚拟 环境 中 物理 特性 的 表示 与 处 理 。 lf 这 人 发 出 了 视觉 接口 方面 的 部 分 硬件 ， 在 软件 设 
计 上 也 取得 了 硅 的 成 果 。 北 京 航空 航天 大 学 计算 机 系 虚拟 现实 与 可 视 化 新 技术 研究 室 开发 
的 分 布 式 虚 拟 环 境 基础 信息 平台 (DVENET) 可 以 实现 不 同 用 户 以 不 同 的 交互 方式 在 虚拟 环境 








下 进行 异地 协同 ， 其 技术 水 平 已 接近 美国 的 STOW。 
除 此 之 外 ， 浙 江 大 学 也 对 虚拟 现实 技术 进行 了 深入 的 研究 。 该 大 学 的 CAD&CG 国家 重 
点 实验 室 开 发 了 一 套 桌面 型 虚拟 建筑 环境 实时 漫游 系统 ， 其 在 实时 性 和 画面 的 真实 感 方面 





达到 了 较 高 的 水 平 。 


清华 大 学 计算 机 科学 和 技术 系 对 虚拟 现实 和 临场 感 方 面 进行 了 研究 ， 提 出 了 很 多 新 颖 的 
算法 ， 如 球面 屏幕 显 示 和 图 像 随 动 、 克 服 立体 图 闪烁 的 措施 和 深度 感 实验 等 ， 其 开发 的 机 器 
人 化 生产 系统 开发 工具 软件 已 近 完成 。 

西安 交通 大 学 信息 了 
研究 ， 并 取得 了 成 就 ， 如 具有 高 压缩 比 、 信 噪 比 及 解压 速度 的 基于 了 PEG 标准 的 压缩 编码 新 








方案 等 。 





























立体 眼镜 等 产品 。 
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北方 工业 大 学 CAD 研究 中 心 是 我 国 很 早 开展 计算 机 动画 研究 的 单位 之 一 。 该 中 心 在 多 年 
的 研究 基础 上 制作 了 一 
中 国 科技 开发 院 威海 分 院 主要 研究 虚拟 现实 中 视觉 接口 技术 , 并 成 功 开发 出 了 LCD 红 多 

































































[ 程 研 究 所 对 虚拟 现实 中 的 关键 技术 一 一 立体 显示 技术 进行 了 深入 的 





系列 体 视 动 画 产 品 。 


























此 外 ， 哈 尔 滨 工 业 大 学 计算 机 系 、 西 北 工业 大 学 CAD/CAM 研究 中 心 、 上 海 交 通 大 学 图 
像 处 理 及 模式 识别 研究 所 、 国 防 科技 大 学 计算 机 研究 所 ， 以 及 安徽 大 学 电子 工程 与 信息 科学 
系 等 单位 也 对 虚拟 现实 进行 了 积极 的 研究 ， 并 取得 了 一 定 的 成 就 。 


8.1.4 ”虚拟 现实 的 特点 


虚拟 现实 是 一 种 高 度 集成 的 技术 ， 是 计算 机 硬 软件 、 传 感 器 、 机 器 人 、 人 工 智能 (AD 与 模 
式 识别 、 视 觉 模 拟 、 人 体 工程 学 及 心理 学 飞速 发 展 的 结晶 ， 主 要 
依赖 于 三 维 立 体 实时 图 形 显示 、 三 维 定位 跟踪 、 触 觉 及 嗅觉 传 感 
技术 、AI 技术 、 高 速 和 并 行 计算 技术 及 人 的 行为 学 研究 等 多 项 关 
键 技术 的 进展 。 实 际 上 ， 虚 拟 现实 是 一 种 新 的 人 机 接口 形式 ， 为 所 
户 提供 了 一 种 身 临 其 境 和 多 感觉 通道 的 体验 ， 试 图 寻求 一 种 最 佳 的 
人 机 通信 方式 ， 如 图 8.4 所 示 。 _ 多 

Grigore Burdea 在 1993 年 的 国际 电子 学 术 会 议 (Electro93 
International Conference) 上 发 表 的 Virual Realib Syst sad 
4pplications 一 文中 将 虚拟 现实 技术 的 特点 总 结 为 3 个 “Ps 即 ”图 8.4 虚拟 现实 用 户 
Immersion( 沉 浸 感 )、Interaction( 交 互 性 ) 及 Imagination( 构 起 性)。 

这 3 方面 都 与 人 有 关 ， 因 此 可 以 说 ， 虚拟 现实 技术 是 人 与 技术 系统 的 完美 结合 ， 人 在 系统 中 
占有 重要 的 地 位 。 《A NN 

虚拟 现实 最 主要 的 技术 是 沉浸 感 、 庶 拟 现实 技术 追求 的 目标 也 就 是 力求 使 用 户 在 计算 机 
所 创建 的 三 维 虚拟 环境 中 处 于 一 种 “全 身心 投入 ”的 状态 这 有 身 临 其 境 的 感觉 ， 即 沉浸 感 。 
交互 性 主要 是 指 参与 者 通过 使 用 专用 设备， 用 人 类 的 自然 技 能 实现 对 模拟 环境 的 考察 与 操作 
的 程度 。 因为 虚拟 现实 技术 并 不 仅仅 是 用 户 界面 , 它 的 应 用 能 解决 在 工程 、 医 学 、 军 事 等 
面 的 一 些 问 题 ， 这 些 应 用 是 虚拟 现实 设计 者 为 发 他 们 的 创作 性 而 设计 的 ， 所 以 需要 丰 ? 
想象 力 。 上 述 的 技术 要 素 是 相互 关联 的 ， 已 从 对 用 户 的 “存在 ”意识 有 影响 ， 进 而 导致 “ 沉 
浸 感 ” 这 一 过 程 实际 上 是 基于 人 的 “ 认 知 ”机 理 ， 正 像 有 人 说 的 “心理 学 是 虚拟 现实 的 物理 


学 ”(Psychology is the Physics of Virtual Reality)。 






























































8.1.5 ”沉浸 感 


导致 沉浸 感 的 原因 是 用 户 对 计算 机 环境 的 虚拟 物体 产生 了 类 似 于 现实 物体 的 存在 意识 或 
幻觉 (如 图 8.5 所 示 )， 沉 浸 感 必须 具备 以 下 3 个 要 素 。 






































8.5 ”虚拟 现实 技术 要 素 
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一 多 苦 你 找 术 及 站 应 用 (第 县 ) 











一 (D 图 像 imagery)。 虚拟 物体 要 有 三 维 结构 显示 。 图 像 显示 要 有 视 场 。 显 示 画 面 符合 观察 


者 的 视点 ， 跟 随 视线 变化 。 物 体 图 像 能 得 到 不 同 层次 的 细节 审视 。 
(2) 交互 (interaction)。 虚 拟 物体 与 用 户 的 交互 是 三 维 的 。 用 户 是 交互 作用 的 主体 ,用 户 能 
觉得 自己 在 虚拟 环境 中 参与 物体 的 控制 。 交 互 是 多 感知 的 ， 用 户 可 使 用 与 现实 生活 不 同 的 方 
式 来 与 虚拟 物体 交互 。 
(3) 行为 (behavior)。 虚 拟 物体 在 独立 活动 或 相互 作用 时 ， 或 在 与 用 户 的 相互 作用 中 ， 
动态 都 要 有 一 定 的 表现 ， 这 些 表现 或 服从 于 自然 规律 ， 或 者 遵循 设计 者 想象 的 规律 ， 这 也 被 
称 为 虚拟 系统 的 自主 性 。 



























































8.2 ”虚拟 现实 系统 分 类 





8.2.1 依照 庶 拟 现实 与 外 界 交互 分 类 1 
从 虚拟 现实 与 外 界 的 交互 考虑 ， 虚 拟 现实 系 wg oda 
1， 封闭 式 虚拟 现实 





封闭 式 虚 拟 现实 即 与 外 部 oa 其 特点 如 下 。 

(1) 虚拟 环境 可 以 是 任意 虚构 的 实际 上 不 在 的 世界 。 

(2) 目的 是 为 了 娱乐 、 训 练 、 模拟 预演 、 检验 、 体 验 或 验证 某 一 猜想 假设 等 。 

(8) 任何 操作 不 对 外 界 “ 生 直 接 代 用， 着 

2， 开 放 式 庶 拟 现实 XL 

开放 式 虚拟 现实 即 通 过 各 种 传 感 装置 与 wR 其 特点 如 下 。 

(1) 虚拟 环境 是 某 某 六 现实 世界 的 真实 模型; 

(2) 目的 是 通过 j 用 虚拟 环境 对 现实 世界 进行 直接 操作 或 遥控 操作 , 以 达到 克服 现实 环境 
的 限制 使 操作 方便 、 可 靠 ， 如 提供 碰撞 报警 ， 减 轻 操 作 人 员 的 心理 负担 ， 减 少 操作 失误 等 。 

(3) 按 用 户 的 需要 ， 操 作 可 以 直接 作用 于 现实 世界 或 得 到 反馈 

3. 封闭 式 虚 拟 现实 和 开放 式 虚 拟 现实 的 结合 

封闭 式 虚 拟 现实 和 开放 式 虚拟 现实 的 结合 即 兼备 封闭 式 或 开放 式 的 特点 ， 是 一 种 较 实 
的 虚拟 现实 系统 。 
8.2.2 ”依照 虚拟 现实 的 构成 特点 分 类 

根据 虚拟 现实 的 构成 特点 ， 虚 拟 现实 系统 分 类 如 下 。 

1， 桌面 虚拟 现实 系统 

利用 微型 计算 机 或 低档 工作 站 进行 模拟 ， 在 一 些 专用 硬件 和 软件 的 支持 下 ， 参 与 者 可 在 
仿真 过 程 中 设计 各 种 环境 。 这 种 系统 基于 WIMP 用 户 界 面 即 窗口 (Window)、 图 标 (Icom)、 鼠 
标 (Mouse)、 指 示 器 (Pointer)， 成 本 低 ， 便 于 普及 ， 也 称 为 窗口 中 的 虚拟 现实 。 


桌面 虚拟 现实 系统 要 求 参与 者 使 用 位 置 跟踪 器 和 手 拿 输入 设备 ， 如 3 或 6 自由 度 鼠 标 、 
游戏 操纵 杆 或 力矩 球 ， 参 与 者 虽然 坐 在 监视 器 前 面 ， 但 可 以 通过 屏幕 观察 范围 内 的 虚拟 环境 ， 
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但 并 没有 完全 沉浸 ， 因 为 其 仍 会 感觉 到 周围 现实 环境 的 干扰 。 

在 桌面 虚拟 现实 系统 中 ， 立 体 视 觉 效 果 可 以 增加 沉浸 的 感觉 。 一 些 廉价 的 三 维 眼镜 和 安 
装 在 计算 机 屏幕 上 方 的 立体 观察 器 、 液 晶 显示 眼镜 等 都 会 产生 一 种 三 维 空间 的 幻觉 。 同 时 
于 它 采用 标准 的 显示 器 和 立体 图 像 显 示 技术 ， 其 分 辨 率 较 高 ,价格 较 便宜 ， 因 此 易 普 及 应 用 ， 
使 得 桌面 虚拟 现实 系统 在 各 种 专业 应 用 中 具有 生命 力 ， 特 别 在 工程 、 建 筑 和 科学 领域 内 。 例 
如 ，Apple 公司 推出 的 快速 虚拟 系统 (QuickTime VR)。 它 采用 360? 全 景 拍 摄 生成 逼真 的 虚拟 情 
景 ， 用 户 可 以 在 普通 的 计算 机 上 ， 利 用 鼠标 和 键盘 ， 就 能 真实 地 感受 到 所 虚拟 的 情景 。 这 种 
系统 的 特点 是 简单 、 价 格 低廉 ， 易 于 普及 推广 ， 是 一 套 经 济 实用 的 系统 。 


2. 临 境 虚 拟 现实 系统 


临 境 虚拟 现实 系统 也 称 投入 式 虚 拟 现实 系统 。 利 用 使 参与 者 完全 投入 的 各 种 设备 ， 如 
HMD( 如 图 8.3 所 示 )、 位 置 跟踪 器 或 舱 型 模拟 器 等 把 用 户 的 视觉 、 Re 觉 封闭 起 来 ， 
产生 一 种 与 世 隔绝 而 被 虚拟 环境 笼 音 的 错觉 ， 达到 完全 投入 的 | 芝加哥 伊利 诺 伊 大 学 
电子 可 视 化 实验 室 开发 的 CAVE 自动 化 虚拟 环境 (CAVE AN NA Virtual Environment), 可 让 
一 人 或 多 人 感到 被 高 分 辩 率 的 三 维 图 像 、 声 音 彻 底 包 

还 有 一 类 增强 现实 型 系统 可 用 于 维修 指导 ， 庆 可 视 现象 的 可 视 化 处 理 。 光 学 器 件 将 
反映 现实 环境 的 图 像 送 至 穿 透 性 屏幕 ， pp 以 同时 看 到 计算 机 生成 的 具有 说 明 描述 
物理 任务 的 文字 0 人 于 位 置 跟踪 技术 。 

临 境 虚 拟 现实 系统 与 桌面 虚拟 现 的 不 同 之 处 有 如 下 几 点 。 

(1) 具有 高 度 的 实时 性 能 。 如 当 ee 虚拟 环境 必须 以 足够 小 的 
延迟 连续 平滑 地 修改 景区 图 像 全 WA 

C) 同时 使 用 多 种 输 六/ 箱 出 设备 。 

(3) 为 了 能 够 提供 “ 真 真实 ” 的 体验 ， 它 总 是 尺 能 利用 最 先进 的 软件 技术 及 软件 工具 ， 因 
此 虚拟 现实 系 :从 集成 了 许多 大 型 复杂 的 软件 ， 如 何 使 各 种 软件 协调 工作 是 当前 虚拟 
现实 研究 的 一 个 热点 。 

(4) 它 总 是 尽 可 能 利用 最 先进 的 硬件 设备 、 软件 技术 及 软件 工具 , 这 就 要 求 虚拟 现实 系统 
能 方便 地 改进 硬件 设备 及 软件 技术 ， 因 此 必须 用 比 以 往 更 加 灵活 的 方式 构造 虚拟 现实 系统 的 
软 、 硬 件 体系 结构 。 

(5) 提供 尽 可 能 丰富 的 交互 手段 。 在 设计 虚拟 现实 系统 的 软件 体系 结构 时 不 应 随便 限制 
各 种 交互 式 技术 的 使 用 与 扩展 。 


分 布 式 虚 拟 现实 系统 
在 临 境 虚拟 现实 系统 的 基础 上 将 不 同 的 用 户 连接 在 一 起 ， 共 享 同一 个 虚拟 空间 ， 使 用 户 
达到 一 个 更 高 的 境界 ， 分 布 式 虚拟 现实 的 基础 是 分 布 式 交互 仿真 ， 如 不 同 地 点 的 工作 人 员 通 
过 网 络 一 起 协同 进行 工业 产品 的 装配 。 
































































































































8.3 ”虚拟 现实 系统 的 组 成 











虚拟 系统 的 模型 可 用 图 8.6 表示 ， 在 系统 组 成 上 一 般 包括 检测 、 反 馈 、 传 感 器 、 控 制 、 
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_3D 模型 及 建 模 模块 ， 如 图 8.7 所 示 。 其 中 ， 检 测 模块 主要 用 于 检测 用 户 的 操作 命令 ， 并 通过 
”传感器 模块 作用 于 虚拟 环境 ， 反 馈 模 块 主要 用 来 接受 来 自传 感 器 模块 信息 ， 为 用 户 提供 实时 
反馈 ;传感器 模块 不 仅 接受 来 自用 户 的 操作 命令 ， 并 将 其 作用 于 虚拟 环境 ， 而 且 将 操作 后 产 

生 的 结果 以 各 种 反馈 的 形式 提供 给 用 户 ; 控制 模块 主要 是 对 传感器 进行 控制 ， 使 其 对 用 户 、 


虚拟 环境 和 现实 世界 产生 作用 ; 建 模 模块 主要 用 来 获取 现实 世界 组 成 部 分 的 三 维 表示 ， 并 由 
此 构成 对 应 的 虚拟 环境 。 












































































































































外 部 业内 





3D 模 异 






NA 图 87 [二 系统 的 组 成 


末 而 大 所 殉 从 问 六 入 坟 和 所 现实 系统 之 间 的 主要 剖 在 于 参与 着 身 几 贡 壤 的 程度 ， 这 
也 是 它们 的 系统 结构 、 应 用 领域 和 成 本 都 大 不 相同 的 原因 。 前 者 以 常规 的 CRT 彩色 显示 器 和 
立体 眼镜 来 增加 身 临 其 境 的 感觉 ， 主 要 交互 装置 为 6 自由 度 鼠 标 或 三 维 操纵 杆 ， 参 见 图 8.8 
所 示 的 桌面 虚拟 现实 系统 的 结构 图 。 后 者 采用 HMD 现实 ， 主 要 交互 装置 为 数据 手套 和 头 部 
跟踪 器 ， 图 8.9 所 示 的 是 临 境 虚拟 现实 系统 的 结构 图 。 
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图 像 合成 
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图 8.8 ”桌面 虚拟 现实 系统 的 结构 图 
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NAN 
图 8.9 临 境 虚拟 现实 系统 结构 图 
无 论 是 桌面 虚拟 现实 系统 还 是 临 境 虚 拟 现实 系统 ， 它 们 都 由 可 交互 的 虚拟 环境 、 虚 拟 现 
实 软件 、 虚 拟 现实 硬件 (包括 计算 机 、 虚 拟 现实 输入 ) 输 出 设备 )3 部 分 组 成 。 

可 交互 的 虚拟 环境 是 由 计算 机 生成 的 ;通过 视觉 、 听 觉 、 触 觉 、 味 觉 等 多 种 感官 作用 于 
户 ， 使 之 产生 身 临 其 境 感觉 的 交互 式 视 景 仿真 。 虚 拟 环 境 可 以 基于 某 种 现实 环境 ， 也 可 以 
完全 脱离 现实 世界 。 oy > | XXX 

虚拟 现实 软件 是 提供 实时 观察 和 参与 虚拟 环境 能 为 的 软件 系统 ， 包 括 虚拟 环境 建 模 、 动 
画 制 作 、 物 理 仿真 、 碰 捞 检 测 和 交互 模式 4 个 方面 。 

虚拟 现实 硬件 则 是 构造 虚拟 现实 系统 的 物理 设备 ， 主 要 包括 计算 机 、 虚 拟 现 实 输入 设备 
(如 数据 手套 )、… 培 拟 现实 输出 设备 (如 数字 美 套 : 

参与 者 可 以 通过 虚拟 现实 输入 设备 将 头 、 手 位 置 等 信息 输入 计算 机 ， 虚 拟 现实 软件 对 其 
进行 分 析 解 释 ， 作 用 于 虚拟 环境 ， 使 之 进行 适当 的 更 新 ， 并 通过 虚拟 现实 输出 设备 反馈 给 参 
与 者 。 















































8.4 ”虚拟 现实 技术 研究 的 内 容 





虚拟 现实 技术 是 一 项 发 展 中 的 技术 ， 要 走向 成 熟 需 要 计算 机 硬件 、 软 件 、 传 感 器 、 人 工 
智能 等 技术 的 进一步 发 展 和 相关 技术 的 支持 。 我 国 更 要 花 大 力气 赶 上 世界 先进 水 平 。 
内 许多 专家 建议 虚拟 现实 技术 的 主要 研究 内 容 如 下 。 

1. 逼真 模拟 世界 生成 技术 

基于 视觉 、 上 听觉、 触觉 和 嗅觉 的 逼真 模拟 世界 生成 技术 的 核心 是 三 维 实时 动画 、 视 觉 环 
境 建 模 (如 图 8.10 所 示 )， 提 供 空间 定位 和 空间 仿真 技术 、 声 像 一 体 化 仿真 技术 ， 并 解决 虚拟 
环境 中 的 标定 问题 等 。 目 前 触觉 传 感 技术 已 达 实 用 水 平 ， 触 觉 的 生物 力学 与 心理 物理 学 方面 
的 研究 是 薄弱 环节 ， 嗅 觉 技 术 的 研究 也 刚刚 起 步 。 
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轩 万 视 图 









晤 各 视图 





图 8.10 视差 原理 及 体 视图 的 3DS MAX 生成 


2， 临场 感 技术 
人 与 技术 融 为 一 体 的 临场 感 技术 的 核心 为 宽 视 场 立体 显示 技术 (如 图 8.11 所 示 )， 感 知 并 
识别 用 户 视点 变化 , 头 、 手 、 肢 体 、 身躯 动 作 和 语音 的 基于 自然 方式 的 人 机 交互 技术 (如 图 8.12 
所 示 )， 人 快速 、 高 精度 三 维 跟踪 技术 ， 人 的 因素 与 用 户 心 究 等 @> 





图 8.12 基于 自然 方式 的 人 机 交互 技术 
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es | 
虚拟 现实 技术 本 


3. 虚拟 环境 的 控制 系统 

虚拟 环境 的 控制 系统 的 核心 技术 为 实时 、 低 延 时 控制 软 硬 件 设 计 ， 传 感 技术 和 传 感 设备 
研究 ， 多 传感器 数据 融合 、 遥 感 技术 等 。 在 方法 上 还 需要 研究 虚拟 环境 与 现实 环境 的 一 致 性 
保持 问题 。 

4. 非 应 用 虚拟 环境 技术 不 可 的 领域 


虚拟 环境 技术 特点 在 于 其 模型 世界 可 以 是 真实 世界 的 仿真 ， 也 可 以 是 抽象 概念 建 模 ， 
户 在 虚拟 环境 里 有 临场 感 ， 并 能 以 自然 方式 与 模拟 世界 进行 人 机 交互 操作 。 因 此 ， 开 发 非 应 
虚拟 环境 技术 不 可 的 新 应 用 领域 ， 并 进行 相应 的 系统 分 析 与 设计 ， 将 对 深入 研究 虚拟 现实 
技术 产生 深远 的 影响 。 应 用 研究 包括 系统 开发 平台 研制 、 分 布 式 虚 拟 现实 技术 及 实际 系统 开 


发 等 。 
丛 
8.5 NA 



























































与 传统 的 信息 系统 相 比 ， 虚 拟 现实 系统 是 一 em 4 系统 。 
在 这 种 虚拟 系统 内 ， 人 们 所 感受 到 的 突出 的 eh 当 感 、 交 互 性 和 构想 性 。 为 了 实现 
这 种 新 型 的 信息 处 理 系统 ， ee ey 交互 性 和 构想 性 要 
求 又 在 不 断 提 高 。 

， 提 高 图 形 系统 的 实时 性 | RS 交 和 

pe tt 这 是 当前 限制 庶 
拟 现实 画面 速度 的 重要 因素 。 在 不 降低 图 形 的 杂 度 的 前 担 下， 如 何 提高 刷新 频率 将 
是 虚拟 现实 技术 所 要 研究 的 关键 内 容 之 一 。 站 。、 

2， 三 维 位 置 启 位 跟踪 与 传 感 及 识别 技术 、 

三 维 位 置 方位 跟踪 与 视觉 、 听 觉 、 嗅 觉 等 传 感 及 识别 技术 要 靠 输入 和 输出 设备 实现 。 输 
入 系统 帮助 参与 者 发 出 数据 ， 投 入 到 虚拟 环境 中 ， 并 与 系统 进行 交互 式 交流 。 键 盘 、 鼠 标 、 
力 抵 球 、 位 置 跟踪 器 (如 图 8.13 所 示 )、 数 据 手套 等 都 是 典型 的 虚拟 现实 系统 输入 工具 。 


入 


图 8.13 ”部 分 位 置 跟踪 器 
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下 多 媒体 找 坟 六 其 应 用 第 之 服 ) 


一 ”虚拟 现实 的 输入 、 输 出 技术 要 求 计 算 机 能 够 理解 操作 者 的 各 种 动作 和 发 出 的 信息 ， 这 些 











识别 问题 大 部 分 是 不 确定 的 问题 。 这 类 问题 的 解决 需 借 助人 工 智能 和 知识 工程 。 例 如 ， 目 前 
人 工 智能 接口 中 研究 的 图 像 识别 、 机 器 视觉 、 语 音 识别 和 自然 语言 。 

3 高 速 计算 能 力 及 计算 复杂 性 问题 

个 人 计算 机 的 性 能 价格 比 为 一 般 大 众 所 接受 ， 但 其 计算 和 图 形 等 功能 在 虚拟 系统 组 成 中 
显得 很 勉强 ， 只 能 用 于 低级 的 虚拟 系统 。 
工作 站 的 性 能 要 比 个 人 计算 机 高 得 多 ,通常 以 性 能 优良 的 UNIX 系统 为 操作 系统 ,计算 、 
图 形 、 语 音 等 处 理 能 力 较 适合 虚拟 系统 的 组 成 ， 是 目前 较为 普遍 的 虚拟 系统 用 机 。 
目前 许多 高 级 虚拟 环境 的 实现 由 超级 计算 机 系统 支持 ， 并 带 有 高 速 图 形 工作 站 。 超 级 计 
算 机 有 多 个 处 理 器 ， 也 可 称 为 多 处 理 机 ， 它们 采用 并 行 处 理 体系 结构 ， 允许 多 达 100 个 处 理 
器 同时 为 虚拟 系统 服务 ， 使 系统 的 性 能 达到 最 佳 。 

4. 面向 对 象 技术 的 应 用 


虚拟 构造 境界 程序 可 以 生成 各 种 虚拟 现实 应 用 ， 这 类 应 au 它 使 得 参与 者 
可 以 在 仿真 中 操纵 其 环境 。 构 造 场景 包括 建 模 和 绘制 这 些 对 象 指定 行为 ， 提 供 交互 
性 和 编程 。 面 a 中 轻重 的 作用 。 


5， 三 维 建 模 


OO 而 虚拟 环境 建 模 技术 则 是 整个 系统 建立 的 
基础 ， 主 要 包括 三 - 失 视 呈 囊 模 乔 于 王建 其 中 ， 视觉 建 模 : 主要 包括 几何 建 模 (Geometric 
1 Modeling)( 如 图 814 所 示 )、 物 理 建 模 (Physical 
Modeli Ebest Behavior) 建 模 及 模型 切 
os 

I 系统 集成 技术 

虚拟 现实 中 需要 涉及 大 量 多 通道 感知 信息 ， 如 
何 将 这 些 感知 信息 进行 系统 集成 与 整合 将 是 虚拟 现 
实 需要 研究 的 一 个 至 关 重 要 的 内 容 。 集 成 技术 包括 
图 8.14 ”使 用 NURBS 技术 进行 几何 建 模 ”同步 技术 、 模 型 标定 技术 、 数 据 转换 技术 、 识 别 和 

合成 技术 等 。 


8.6 ”虚拟 现实 的 应 用 
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egmentation) 等 








虚拟 现实 技术 是 一 个 新 的 发 展 方向 ， 目 前 还 不 成 熟 ， 但 已 成 为 一 个 研究 的 热点 ， 并 会 对 
整个 科学 技术 和 人 们 的 生活 产生 深远 的 影响 。 
1. 可 视 化 的 研究 与 应 用 
可 视 化 技术 和 虚拟 现实 技术 紧密 相关 ， 可 视 化 是 解决 各 种 复杂 环境 问题 的 工具 ， 各 行 各 
的 专家 都 可 以 根据 问题 的 计算 机 模型 进行 可 视 化 研究 。 科 学 与 工程 计算 可 视 化 不 仅 可 用 三 
形 直观 地 对 计算 机 获得 的 大 量 数据 分 析 或 计算 结果 进行 图 示 或 图 解 ， 而 且 利 用 交互 式 技 


















































语 长 
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术 可 改变 物理 或 其 他 过 程 的 参数 ， 实 时 观察 计算 结果 的 全 貌 ,使 人 们 能 够 利用 图 形 的 直观 性 、 





形象 性 和 可 操作 性 ， 把 握 问题 的 总 体 变化 趋势 ， 了 
金融 的 可 视 化 ， 通 过 建立 金融 模型 ， 可 将 大 量 抽象 


使 数据 更 容易 被 理解 和 分 析 。 股 票 市 场 就 是 这 种 技术 的 


2.， 工程 的 计算 机 辅助 设计 和 制造 
在 传统 产品 制造 过 程 中 ， 原 型 的 加 工 、 设 计 和 


解 
的 字母 








生产 都 


享 。 随 着 CAD、 计 算 机 辅助 工艺 (CAPP) 和 CAM 的 标准 化 ， 





计算 机 集成 制造 系统 CIMS 的 核心 。CIMS 环 
境 下 计算 机 辅助 设计 和 制造 (CAD/CAM) 最 根本 的 
目标 是 要 实现 了 子 系统 内 部 各 功能 模块 及 与 其 他 子 








系统 间 的 信 并 实现 各 模块 本 身 的 功能 ， 如 
图 8.15 所 在 CAD/CAPP/CAM 集成 系统 中 , 有 


各 个 子 系统 的 专用 静态 数据 , 亦 有 供 各 个 功能 模块 
共用 的 动态 数据 。CAD 的 任务 是 根据 计划 管理 部 
门下 达 的 设计 、 加 工 任务 ,用 专家 系统 进行 产品 方 
案 设计 ， 由 此 进行 几何 建 模 、 工 程 分 析 ， 直 至 产生 
详细 的 工程 图 和 CAPP/CAM 所 需 信 息 。 


3， 医 学 方面 的 应 用 









系 


虚拟 现实 





统 已 应 用 于 医学 系统 > 使 用 虚拟 现实 

















寻找 最 优 解 的 控制 过 程 。 例 如 ， 
数据 变 成 图 形 或 可 见 的 物体 ， 从 而 




















主要 领域 。 


有 独特 的 工 艺 流 程 ， 不 允许 数据 共 
这 些 工艺 就 被 集成 到 一 个 系统 中 ， 





图 8. 


系统 








15 ”虚拟 现实 技术 在 车 辆 设计 中 的 应 用 


;可 以 建立 合成 药物 的 分 子 结构 模 


型 ， 测 试 其 特性 ， 诊 断 疾病 , 模拟 人 体 解 剖 或 外 科 手 术 的 过 程 ， 缩 短 医生 培训 周期 。 
使 用 UNC 的 grope I 虚拟 仿真 器 , 研究 人 员 可 以 看 到 一 种 药物 内 分 子 是 如 何 同 其 他 的 生 
化 物质 相互 作用 的 ,一 并 测试 其 特性 ， 这 一 技术 大 大 缩短 了 各 种 新 药物 的 开发 周期 。 




















近年 来 ， 大 们 用 微型 摄像 机 、 计 算 机 畏 何 又 射 












线 摄 


彤 (CAT) 或 磁 共 振 成 像 (MRI) 获 得 一 
此 图 像 构成 3D 数据 场 ， 通 过 虚拟 现实 眼镜 可 观察 到 病灶 图 像 。 医 生 使 用 这 
断 ， 就 不 必 执 行 一 些 侵入 性 的 医疗 步骤 。 


在 虚拟 外 科学 中 ， 从 和 手术 部 是 虚拟 的 ， 因 此 ， 如 果 虚 拟 病人 死亡 了 ， 实 习 医 生 可 以 
和 起 死 回 生 。 手 术 具 有 可 回溯 性 ， 实 习 医 生 通过 多 次 虚拟 手术 ， 积 累 经 验 ， 为 今 




































也 可 





4. 军事 模拟 和 飞行 模拟 





军事 模拟 是 虚拟 现实 产生 和 发 展 的 一 
基础 和 强大 动力 ， 最 初 的 模拟 是 用 来 训 线 。 飞 行 员 


通过 虚拟 的 飞行 环境 ， 熟 悉 行 过 程 中 可 能 出 现 的 
图 





各 种 情 


况 及 对 付 方法 ， 图 8.16 所 示 的 是 飞机 中 的 三 维 图 像 。 














飞行 模拟 器 只 能 模拟 驾驶 舱 内 外 的 情况 ， 范 围 











有 限 ， 


进一步 扩大 范围 ， 可 进行 作战 规划 模拟 。 军 事 模拟 技术 也 
可 用 于 民航 的 飞行 员 训练 、 航 天 计划 的 宇航 员 训 练 。 





























旦 手术 ， 即 医生 对 异地 的 病人 施行 手术 ， 在 不 久 的 将 来 也 





图 8.16 飞机 机 舱 的 三 维 图 像 
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一 5. 教育 和 艺术 
近代 在 教育 领域 进行 着 - 


下 多 媒体 找 坟 及 其 应 用 (第 之 服 ) 





-系列 改革 传统 教学 方法 的 革命 。 从 以 音响 设备 为 主体 的 电化 教 


学 到 加 入 计算 机 的 CAI， 从 多 媒体 网 络 到 虚拟 教学 环境 ， 高 新 科技 的 引进 大 大 推动 着 教育 事 





业 的 发 展 。 


计算 机 辅助 教育 (CAE) 是 一 门 新 崛起 的 教育 技术 ，CAI 是 其 中 一 个 重要 的 分 支 ， 在 CAE 





和 CAI 中 引进 虚拟 现实 将 使 学 生 亲 身 经 历 知 识 的 传授 过 程 ， 并 留 下 深刻 的 印象 ， 从 而 获得 理 
想 的 教学 效果 。 在 虚拟 现实 环境 下 ， 学 生 可 以 完全 投入 ， 在 仿真 过 程 中 跨越 时 空 限制 与 环境 
中 的 各 种 目标 对 话 ， 从 而 学 习 新 的 知识 ， 加 深 对 抽象 事物 的 理解 。 

















6 有 适 在 和 喧 控 

对 人 类 不 能 到 达 (深海 、 其 他 星球 ) 或 危险 、 有 毒 的 场所 ， 远 程 I 虚 
拟 现实 的 产生 受到 太空 技术 、 机 器 人 技术 的 推动 ， J ， 机 器 人 的 远程 控制 
可 在 虚拟 环境 中 进行 ， 通 过 对 远程 存在 和 控制 的 应 用 ， Ko a 

7.， 游戏 与 娱乐 

a 

















别 是 对 青少年 的 业余 生活 影响 更 大 。 在 电子 游戏 中 ， 参 与 者 往往 要 充当 其 中 一 个 角色 与 虚拟 
环境 及 其 目标 进行 交互 影响 ， 这 点 正 是 及 加 现实 技术 的 一 人 个 关键 方面 。 


87 二 


i 雷达 、 wi -可视化 计算 等 扩大 人 类 视觉 等 能 力 的 研 
究 成 果 一 样 ， 虚拟 显示 系统 所 提供 的 一 系列 究 成 果 是 为 了 进 一 步 扩 大 人 类 的 感知 和 认 知 能 


力 。 因 此 ， 虽 然 我 们 可 以 利 





虚拟 现实 技术 区 虚构 一 些 鬼 怪 精灵 、 太 虚 仙 境 ， 提 供 比 游乐 园 








更 吸引 人 的 游戏 ， 但 更 重要 的 还 是 利用 虚拟 现实 的 手段 ， 打 破 现 有 技术 手段 的 限制 ， 拓 宽 人 
类 认识 世界 的 认识 空间 ， 提 高 人 类 认识 客观 世界 的 方法 空间 ， 并 尽力 使 认识 空间 与 方法 空间 








协调 一 致 。 























我 们 利用 虚拟 现实 技术 





的 成 果 去 创建 一 些 以 假 乱 真 的 虚拟 对 象 ， 目 的 是 为 了 突破 人 类 现 








有 感知 能 力 的 界限 ， 是 为 了 提高 人 类 认识 世界 的 深度 和 广度 ， 是 为 了 更 正确 地 反映 客观 世界 


的 本 质 。 
创建 虚拟 对 象 和 
和 改造 世界 的 目的 。 


























0 环境 是 认 知 世界 和 改造 世界 的 手段 ， 反 映 现实 的 本 质 和 属性 是 认识 世界 











虚拟 技术 和 其 他 许多 先进 技术 的 出 现 ， 必 然 会 推动 生产 管理 模式 的 变化 。 、 日 本 和 
欧洲 已 经 认识 到 ， 一 种 新 的 制造 系统 模式 已 经 开始 形成 ， 这 就 是 “ 灵 捷 制造 > ， 如 图 8.17 


所 示 。21 世纪 灵 捷 























剖 造 模式 的 特点 首先 是 产品 改 型 对 市 场 需求 的 快速 反应 性 ;其 次 是 公司 规 








模 、 组 成 及 管理 模式 随 生产 任务 变化 的 快速 响应 性 ， 最 后 是 坚持 高 质量 、 优 质 服务 的 秩序 性 。 








而 高 度 灵活 的 柔性 4 
验证 。 
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E 产 系统 是 实现 灵 捷 制造 的 必要 支撑 条 件 ， 其 中 包括 虚拟 设计 和 虚拟 制造 


第 8 章 如 


虚拟 现实 技术 





图 8.17 虚拟 技术 与 灵 捷 制造 

虚拟 技术 不 仅 支持 灵 捷 制造 系统 的 建立 , 而 且 可 以 使 整个 设计 制造 过 程 对 用 户 是 透明 的 ， 

设计， 这 也 是 灵 捷 制造 的 重要 特点 之 一 
虚拟 现实 技术 的 潜力 是 很 大 的 ， 现 在 正 处 于 推广 -应 用 的 开 始 阶段 。 虚 拟 现实 技术 将 引起 
放 外 催生 有 变 ， 目 前 已 有 相当 数量 的 科技 人 员 在 筹划 把 这 项 技术 用 于 设计 未 来 的 高 速 公 
控制 系统 、 导 弹 发 射 指挥 和 控制 中 心 的 设计 、 新 型 飞机 的 设计 、 战 斗 机 驾驶 员 座 
、 航 天 飞机 芯 人 的 设计 及 对 复杂 人 
E 拟 现实 技术 将 学 将 是 虚拟 现实 技术 应 用 重要 ， 目 前 的 虚 
经 开 如 对 页 二 :巨大 冲击 。 医生 和 病 兴 都 将 从 虚拟 技 受益 。 虚拟 现实 技 
中 显示 出 巨大 的 潜力 3 能 进一步 提高 医学 图 像 的 分 辨 率 和 直观 性 ， 能 
真实 的 力量 反馈 ， 让 培训 与 实际 操作 相 结合 。 
进 遥 在 技术 的 发 展 将 会 扩展 远 距离 通 仅仅 可 
以 wa 看 到 ， 甚至 可 以 互相 和 触摸。 这 将 是 一 种 广 尺 的 多维 前 ， 由 
Super Scape 公司 发 起 、40 多 家 公司 加 盟 的 世界 第 元 个 虚拟 现实 网 球 网 已 投入 运行， 虚拟 现 
实 技术 能 前 景 十 分 诱 人 。 
ss 技术 将 使 教育 培训 设施 发 生 质 的 变化 人 们 将 对 危险 的 操作 反复 地 进行 十 分 逼 
， 将 为 受训 者 设 定 各 种 复杂 的 情况 元 以 提 ， 将 为 运动 员 、 保 安 
A 教 炎 人生 克 让 央 医 生 设置 超 难度 及 洛 斋 直 的 直 训 课程 ， 从 而 使 得 他 们 在 实际 环境 下 得 
情况 。 由 虚拟 现实 技术 所 支撑 的 模拟 和 培训 系统 将 使 得 飞行 器 驾驶 员 、 空 
、 卡 车 驾驶 员 、 医 务 培训 工作 人 员 ， 甚 至 小 汽车 司机 都 可 以 在 安全 的 虚拟 环 













































































































虚 现实 技术 在 帮助 和 增强 残疾 人 的 自理 能 力 方面 也 是 大 有 可 为 的 。 虚 拟 现实 技术 可 以 
帮助 残疾 人 参加 其 所 希望 参加 的 活动 ， 增 强 其 与 社会 交流 和 为 社会 服务 的 能 力 。 虚 拟 现实 技 
术 还 将 有 效 地 辅助 人 类 进行 决策 和 行动 。 传 统 的 计算 机 及 其 应 用 系统 在 辅助 人 类 的 计算 和 退 
辑 思维 能 力 方面 已 发 挥 了 巨大 的 作用 ， 虚 拟 现实 系统 将 进一步 扩充 人 类 的 感知 和 认 知 能 力 ， 
从 而 辅助 人 类 进行 决策 和 行动 。 

















8.8 虚拟 现实 建 模 语言 


随 着 网 络 时代 宽 带 大 规模 应 用 的 到 来 ， 市 场 对 虚拟 现实 技术 的 应 用 越 来 越 迫切 。VRML、 
X3D、Cult3D、Viewpoint、360° 环 视 等 技术 相继 被 提出 并 逐步 被 广泛 应 用 。 而 这 其 中 ， 虚 拟 
现实 建 模 语言 (Virtual Reality Modeling Language，VRML) 作 为 一 种 工业 标准 其 重要 地 位 日 益 
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:oS 


和 下 多 媒体 技术 必 其 应 用 (第 己 矿 ) 

_ 一 VRML 自 1994 年 10 月 在 芝加哥 召开 的 第 二 次 WWW 会 议 上 诞生 以 来 , 受到 了 广泛 的 重 
视 ， 并 在 短期 内 得 到 了 迅猛 的 发 展 ， 于 1997 年 已 经 发 展 到 了 VRML 2.0 规格 。VRML 是 基于 
Web 的 开发 语言 之 一 , 就 是 利用 简单 的 语法 来 生成 动态 的 、 交互 性 强 的 、 支 持 多 用 户 的 VRML 
虚拟 场景 ， 使 Web 页 面 更 生动 、 真 实 。 


8.8.1 简介 


虚拟 现实 建 模 语言 是 一 种 描述 虚拟 现实 场景 的 专用 语言 ， 其 作用 是 描述 三 维 场景 以 便 建 
立交 互 式 、 可 导航 的 三 维 世界 ， 可 用 于 万 维 网 WWW， 和 HTML 一 样 。 虚 拟 现实 的 显示 、 交 
互 和 互联 等 所 有 方面 都 可 以 用 VRML 来 定义 。VRML 设计 者 的 意图 是 将 VRML 变 成 WWW 
上 交互 仿真 模拟 的 标准 语言 。 

VRML 人 允许 用 有 限 的 交互 行为 构造 虚拟 世界 ， 这 些 虚 拟 世 界 包含 同 其 他 “世界 ” 超 链 接 
的 对 象 , 如 超 文 本 置 标语 言 HTML 文本 或 其 他 有 效 的 MIME 类 型 当 用 户 选 择 带 有 超 链 关系 
的 对 象 时 ,就 会 启动 相应 的 MIME 浏览 器 。 当 用 户 在 正确 配置 的 浏览 器 中 选择 链接 到 
VRML 文档 的 对 象 时 ， 一 个 VRML 观察 器 也 会 启动 。 因 此 ;SVRML 观察 器 将 成 为 在 WWW 
上 漫游 、 查 看 信息 的 最 佳 配套 软件 。 未 来 的 VRML A 述 更 丰富 的 行为 ， 包 括 动画 、 
移动 物体 和 实时 多 用 户 交互 功能 。 NE 

VRML 提供 的 三 维 元 素 有 站 点 地 图 、 库 、 区 数据 库 的 可 视 化 代表 、 
模拟 地 理 信 息 系统 、 交 互 式 广告 等 。 六 


8.8.2 ”VRML 的 诞生 与 发 展 XX SN 


1994 年 , 在 第 一 届 际 互联 网 络 全 会 上 ， WWW 之 ha Lee 和 SGI 公司 的 Dave 
Raggett 组 织 了 小 型 会 议 3 eh [多 位 参加 者 介绍 了 在 互联 网 上 构筑 三 
维 图 形 可 视 - 工具 的 项 目 。 会 者 一 致 认为 有 必 让 这 些 工具 使 用 共同 的 语言 来 描述 三 维 场景 
及 WWW 的 连接 ， 即 : 站 个 类 似 于 HTML 的 虚拟 现实 描述 语言 言 。 之 后 ,就 提出 了 虚拟 现实 置 标 
语言 (Virtual cality, Markup Language)， 并 着 手 制定 标准 ， 置 标 (Markup) 后 来 更 改 为 造型 
(Modeling)， 以 VRML 的 图 形 化 特点 。 此 次 会 议 不 久 , 在 WWW 上 展开 了 VRML 第 一 版 
本 开发 和 定义 的 讨论 。 大 多 数 意见 支持 在 现 有 技术 上 寻求 解决 方案 ， 最 后 选择 了 SGI 的 Open 
Inventor 的 ASCII 文本 格式 。 

VRML 自 诞生 以 来 ， 主 要 有 两 个 版 本 ， 即 VRML 1.0 和 VRML 2.0。 

VRML 1.0 版 本 提供 对 三 维 世界 及 其 内 容 基 本 对 象 的 描述 ， 并 把 它们 同 二 维 (HTML) 的 页 
面 链接 起 来 ， 是 一 种 非常 简洁 Nee 它 允 许 创建 有 限 交 互 式 对 象 ， 可 以 自由 地 在 场景 
中 漫游 并 通过 超 链接 到 达 另 一 个 三 维 世 界 、HTML 文本 或 其 他 有 效 的 MIME (Multipurpose 
Internet Mail Extensions， 多 | Ne 
但 是 ，VRML 主要 设计 目标 是 要 成 为 一 个 独立 于 平台 的 、 可 扩展 的 和 通过 低 带 宽 连 接 传 
输 的 描述 语言 -VRML 1.0 只 有 少 部 分 达到 这 些 要 求 (尽管 它 已 具有 了 扩展 到 全 部 功能 的 能 力 )， 
仍然 存在 如 下 一 些 问 题 。 
) 景象 游历 
因为 在 游历 中 要 保存 特性 的 改变 作为 部 分 状态 ， 所 以 改变 单一 特性 就 能 影响 到 场景 图 的 
其 他 分 支 ， 这 使 得 浏览 器 几乎 不 可 能 去 优化 场景 图 。 

2) 细节 水 平 

当 根 据 屏 幕 大 小 实现 显示 细节 水 平时 ， 初 试 的 细节 水 平 点 (Level of Detail，LOD) 就 被 更 

























































































































































































236 





十 实 投 林 | 5 


简单 的 LOD 节点 所 蔡 换 。 该 节点 选择 的 细节 水 平 取决 于 视点 和 显示 对 象 中 心 的 距离 。 这 就 会 
产生 问题 , 因为 包含 这 些 对 象 到 别 的 VRML 文件 时 就 可 以 缩放 它们 , 从 而 导致 不 适当 的 表现 。 
另外 , 大 多 数 对 象 没有 在 所 有 方向 上 得 到 同样 比例 的 缩放 , 最 后 的 视 域 大 小 将 影响 显示 的 大 小 。 
3) 没有 原型 
DEF/USE 格式 在 没有 创建 实例 的 情况 下 不 允许 说 明 场 景 图 的 某 一 部 分 。 
4) 没有 独一无二 的 名 称 
被 DEF 关键 字 附 加 到 节点 上 的 名 称 不 一 定 是 唯一 的 ,因此 这 些 名 称 不 能 指定 场景 图 的 某 
一 部 分 作为 对 象 。 
为 此 ， 随 后 推出 了 VRML 2.0 版 本 。VRML 2.0 版 本 除了 提供 VRML1.0 版 提供 的 基本 功 
能 外 ， 最 重要 的 是 它 使 网 上 的 三 维 世界 动 起 来 了 。 使 用 VRML 2.0， 结 合 Java 及 JavaScript， 
可 以 构建 丰富 多 彩 而 功能 强大 的 虚拟 世界 。 
8.8.3 ”VRML 2.0 简介 Ce Le 


CNN 
VRML 2.0 的 ISO 标准 是 由 SGI 及 SGI 的 两 个 合 llety Research 和 Mitra 设计 的 ， 
最 初 的 建议 草案 来 自 SGI 公司 的 Moving Worlds 楼 入 经 过 修改 ， 最 终 通过 了 投票 表决 ， 成 
为 国际 标准 ， 其 标准 号 为 ISOTECWD 14772。VRML 2.0 推出 的 主要 目的 是 扩展 其 静态 景象 
描述 语言 ， 从 而 使 其 成 为 虚拟 现实 描述 语言 ?| 其 中 包括 交 互 和 对 象 行为 及 对 媒体 的 规范 ， 其 
主要 的 变化 体现 在 节点 型 的 扩充 :ES 节点 可 以 说 是 最 重要 最 基本 的 语法 : 人 位， 其 定义 
包含 节点 名 称 、 域 、 事 件 和 节点 的 功能 、 除了 自 定义 的 节点 类 型 (PROTO) 外 ，VRML 2.0 共有 
54 种 标准 节点 类 型 ， 按 功能 分 厂 9 类 ?组 节点 、 特 殊 节点 、 通 用 节点 、 传 感 器 节点 、 几 何 
























































体 节 点 、 几 何 体 属性 节点 、 外 观 节点 、 揪 值 节点 和 约束 节点 。 为 实现 VRML 应 用 如 虚拟 社区 
和 虚拟 购物 中 心 ， 这 些 扩展 很 有 必要 。 ,a 


VRML 2.0 的 特点 表现 在 以 几 个 方面 :| 
人 

1. 增强 的 三 维 巡 模 能 力 

在 新 的 标准 中 ， 天 空 、 大 地 、 远 景 都 得 到 了 较 完 美的 支持 ， 同 时 还 加 入 了 雾 、 地 形 等 一 
些 新 节点 ， 并 且 对 质 材 、 质 感 的 描述 和 解释 更 加 科学 和 精确 。 

VRML 1.0 中 仅 支 持 ASCII 码 的 文字 模型 , 新 标准 中 则 几乎 包含 了 世界 上 所 有 能 写 出 文字 
的 UTF-8 字符 集 (ISO10646-1，1993 标准 )。 

VRML 2.0 允许 浏览 以 Gzip 压缩 格式 保存 的 文件 , 一 个 较 大 的 场景 往往 可 以 被 压缩 数 倍 ， 
在 VRML 文件 传输 时 大 大 降低 了 对 网 络 的 需求 。 

2. 声音 和 动画 

VRML 1.0 是 不 支持 声音 和 动画 的 , 新 的 标准 不 仅 支 持 WAVE 或 MIDI 文件 ,声音 还 是 三 
维 的 ， 另 外 还 支持 MPEG 活动 图 像 ， 一 些 浏 览 器 还 支持 其 他 的 多 媒体 格式 ， 如 Microsoft 的 
AVI 格式 和 Apple 公司 的 QuickTime 格式 。 

3.， 交互 式 能 力 

交互 式 能 力 是 VRML 2.0 的 最 大 改进 ， 允 许 用 户 对 世界 中 的 三 维 对象 进 行 旋转 、 移 动 等 
操作 。 
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下 多 媒体 找 坟 及 其 应 用 (第 之 服 ) 


一 4. 编程 能 力 


VRML 2.0 可 以 称 得 上 编程 语言 了 ， 其 节点 类 似 于 C++ 和 Java 中 的 结构 和 功能 
绝 大 多 数 VRML 2.0 的 浏览 器 支持 3 种 编程 格式 : 一 是 内 嵌 在 Script 节点 中 的 描述 性 语 











言 ， 这 是 最 简单 方便 的 编程 方法 ， 二 是 在 Script 中 采用 外 部 的 Java 字 节 流 ， 通 常 只 是 为 了 实 





现 一 些 特殊 的 、 描 述 性 语言 不 能 实现 的 功能 ， 或 者 是 为 了 源 程序 保密 ; 三 是 通过 VRML 2.0 
浏览 器 外 部 编程 接口 API 进行 编程 ， 允 许 VRML 虚拟 世界 与 网 页 上 的 其 他 对 象 进行 沟通 。 














一 般 有 3 种 设计 模型 以 支持 VRML 世界 的 交互 行为 。 
(1) 扩展 VRML 语言 规范 ， 加 入 新 的 代码 和 关键 字 ， 使 之 能 很 容易 地 结 
放 的 VRML 语言 规范 中 。 
@ 原型 / 子 类 : 允许 定义 新 的 VRML 节点 ， 而 且 可 以 封装 行为 和 几何 体 。 











合 到 扩展 的 、 开 


@ 事件 监测 :一 个 或 几 个 新 节点 类 可 以 检测 到 输入 设备 或 外 部 应 用 这 种 事件 。 








的 或 外 部 应 用 之 间 的 接口 。 
@ 内 置 行为 ,内置 节点 对 简单 的 场景 图 提供 了 «Rn. 
@ 开放 性 : 可 以 很 容易 地 增加 新 的 、 TD 
(2) 提供 与 场景 

底 地 基于 外 部 脚本 语 

直接 修改 场景 图 。 这 种 方法 






























要 对 规范 做 任何 修改 、 扩 展 及 修改 场景 图 。 


但 是 由 于 


@ 脚本 : 为 实现 复杂 的 行为 ， 新 节点 提供 了 事件 之 间 的 、 hi 


的 接口 并 实现 外 部 脚本 描 ; = 该 提议 能 够 以 最 小 的 扩展 实现 , 并 彻 
， 其 中 大 多 数 是 基于 ,Ja 有 E 通 过 一 个 由 浏览 器 提供 的 应 用 接口 


API 不 


能 在 景象 描述 内 间 Wn TT 来 说 , 这 种 方法 是 


不 开放 的 。 


三 维 VRML 就 是 其 中 之 -不 足 之 处 在 于 它 对 外 部 


Vv 
(3) 在 景象 行为 语 言 中 贿 六 VRML 景象 描述 。 在 于 允许 集成 多 种 媒体 ， 
本 应 用 不 开放 ， 不 允许 用 户 实现 的 行 


0 ed 加 条 要 处 改 汉 R 村 性 ， 就 必须 在 嵌入 的 语言 中 重新 定义 。 






































扩展 到 多 he 决 的 问题 如 下 。 
名 可 缩放 括 户 数量 和 虚拟 世界 的 大 小 及 参加 者 的 分 布 。 


@ 持久 性 : 在 一 个 共享 世界 的 多 个 局 部 备份 上 必须 保证 至 少 一 定 水 平 上 的 持久 。 


@ 锁定 : 为 保证 持久 性 及 防止 分 布 世界 中 的 共享 备份 被 无 权 者 改变 ， 锁 证 
四 同步 : 改变 局 部 备份 必须 同步 地 分 布 到 共享 统一 世界 的 参与 者 。 
@ 行为 : 共享 世界 中 的 对 象 行为 必须 是 分 布 的 、 同 步 的 。 




















定 机 制 十 和 





小 重要 。 


协议 : 当前 采用 的 HTTP 不 能 为 分 布 多 用 户 的 VRML 世界 传输 所 要 求 的 事件 ， 为 此 


必须 实现 一 种 新 的 协议 ， 协 议 的 一 个 重要 特征 就 是 所 用 的 网 络 基础 结构 。 














@ 代理 : 代表 共享 环境 中 参加 者 的 位 置 和 状态 ， 一 般 每 个 用 户 应 能 选择 它 的 代理 。 


8.8.4 ”VRML 世界 的 浏览 和 发 布 





为 使 VRML 描述 的 三 维 景象 可 见 ， 就 需要 浏览 器 。 浏 览 器 负责 解释 VRML 数据 ， 目 前 
VRML 数据 通过 HTTP 协议 传输 , VRML 页 一 般 由 WWW 进行 访问 。 现 在 有 不 少 支持 多 种 软 
硬件 平台 的 VRML 浏览 器 ， 它 们 为 浏览 和 漫游 三 维 景象 提供 不 同 的 用 户 接口 。 其 中 大 多 数 方 




















便 用 户 对 若干 测试 和 漫游 模式 的 选择 ， 如 行走 和 飞行 ， 而且 一 般 可 控制 生成 速度 和 图 








像 质量 。 























控制 面板 进行 安装 或 从 网 络 上 下 载 安 装 。 


Bs 











Microsoft VRML 2.0 Viewer 是 Internet Explorer 自 带 的 VRML 浏览 器 , 可 以 通过 Windows 








第 8 章 _ 有 思 
虚拟 现实 技术 vy 


Cosmo 播放 器 是 由 SGI 公司 开发 的 一 款 VRML 浏览 器 ， 和 Microsoft VRML 浏览 器 相 比 
较 ，Cosmo 播放 器 更 专业 一 些 ， 是 目前 浏览 VRML 2.0 较 普遍 的 浏览 程序 。 相 比 其 他 VRML 
播放 器 ，Cosmo 播放 器 最 大 的 优点 是 对 JavaScript 的 良好 支持 。 其 界面 如 图 8.18 所 示 。 
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图 8.18 ”Cosmo 播放 器 界面 











Cosmo 播放 器 控制 面板 主要 按钮 的 功能 简单 介绍 如 下 + 

时 : 单 击 并 拖 动 鼠 标 ， 可 从 各 个 角度 观看 场景 。 

杞 再: 单 击 并 拖 动 鼠标 ， 可 将 观察 位 置 朝 各 个 方向 移动 。 
国 国 : 单 击 并 拖 动 鼠标 ， 可 将 场景 中 的 形体 向 各 个 方向 移动 。 


团 : 在 形体 旁 单 击 ， 
国 ， 可 以 调整 视 时 ， 


可 以 将 观察 位 置 迅速 移动 到 形体 旁 。 
使 用 户 直 接 面 向 物体 。 


本 时， 可 以 选择 作者 预 设 的 观察 位 置 。 


国 国 : 可 以 撤销 前 
除 此 以 外 ， 还 可 尼 





面 的 动作 或 重 做 撤销 的 动作 。 


选择 其 他 的 VRML 播放 器 六 如 Community Place VRML 2.0 Browser、 
Blaxxun CC3D、LiquidReality 等 。 

VRML 世界 大 多 以 . 
何 种 类 型 的 VRML，.wrl 文件 必须 在 


wrl 为 扩展 名 文件 进行 发 布 。 为 了 让 浏览 器 知道 .wrl 文件 内 保存 的 是 
包含 单独 的 一 行 设置 信息 。 除 此 之 外 ， 还 包括 一 

















三 维 世 界 的 描述 ， 可 在 实时 状态 下 对 其 











进行 浏览 ， 称 之 为 场景 (scene) 或 者 世界 (境界 、world)。 














下 面 的 例子 就 是 





VRML 文件 来 表达 的 三 维 物体 球 ， 该 文件 的 效果 如 图 8.19 所 示 。 
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图 8.19 用 VRML 来 表达 一 个 球 
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下 | 多 焙 体 技术 及 其 应 用 (第 版) 


#VRML V2.0 utf8 

DEF Viewl Viewpoint { 
Position 0 0 10 
description "viewl" } 
DEF view2 Viewpoint 
position 4 2 10 


description "view2" 


Group { 

children [ 

DEF sphere Transform 1{ 
translation 0 1 1 
children [ 


Shape { 
appearance APPearance { Pe I 
f 

material Material { A SN 

diffusecolor 0 1 0} } NN 

geometry Sphere {} } g RR 

jn XO 

1 ) -XA 

从 上 面 的 例子 可 以 看 出 , VRML 文 种 至 少 需 要 一 行 语句 用 以 说 明 其 版 本 与 字符 集 (例子 中 

的 第 一 行 )， 其 文件 的 基本 构成 单元 主要 为 具有 不 同 功能 与 作用 的 节点 。 


8.8.5 ” 建 模 软件 和 创作 工具 


为 了 建立 自己 的 VRME 场景 ， 还 需要 建 模 软件 和 VRML 的 创作 工具 。 使 用 建 模 软件 可 以 
创建 三 维 模型 构成 的 场景 。 许 多 传统 LE 模 软件 和 动画 应 
用 软件 也 可 将 其 数据 按照 VRML 格式 要 求 存储 文件 ， 如 3DS 
Max、Maya 等 。 另 外 还 有 若干 种 文件 转换 器 ， 可 将 现 有 的 三 维 
格式 转换 成 VRML 格式 .VRML 创作 工具 一 例如 图 8.20 所 示 。 

VRML 有 一 些 创作 工具 , 如 SGI 公司 的 Cosmo Create3D、 
放射 软件 国际 公司 (Radiance Software International) 的 Ez3D 和 
Caligari 公司 的 Fountain， 这 些 工具 都 可 以 快速 、 高 效 地 创建 
效果 动人 的 VRML 文件 。 功 能 强大 的 工具 软件 还 可 支持 细节 
层次 节点 、 锚 定 节点 、 内 联 节点 等 。 一 个 性 能 良好 的 软件 包 还 
应 包括 一 些 工 具 ， 能 制作 动画 、 描 述 脚本 、 沟 通 事件 联 线 、 定 

图 8.20 VRML 创作 工具 一 例 。 义 原型 、 增 减 多 边 形 、 制 作 纹理 编辑 等 。 

8.8.6 ”开辟 一 个 虚拟 世界 

建立 一 个 虚拟 世界 ， 如 图 8.21 所 示 ， 一 般 需 要 如 下 几 个 步 又。 

(1) 从 基本 框架 开始 , 设计 一 个 描述 虚拟 世界 中 关键 人 物 和 行为 的 故事 概要 。 设计 故事 概 
要 即 在 设计 模型 前 要 设计 的 一 个 基本 方案 。 需 要 考虑 如 下 问题 : VRML 的 目的 是 什么 ,什么 
样 的 观众 会 访问 该 世界 ， 该 故事 有 什么 样 的 故事 情节 等 。 
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图 8.21 虚拟 世界 实例 


(2) 构建 物体 并 组 成 世界 。 在 该 步骤 中 ， 要 列 出 组 成 虚拟 世界 的 所 有 物体 ， 并 分 析 那 些 物 
体 及 其 纹理 和 材质 。 首 先 给 物体 配 上 简单 的 颜色 ， 以 后 再 修饰 。 在 建立 模型 前 ， 确 定 要 加 入 
的 动画 以 便 设 定 一 个 合适 的 变换 层次 。 

(3) 添加 动画 和 脚本 。 一 旦 创建 了 基本 物体 , 就 可 以 加 入 插 补 器 , 编写 脚本 来 给 物体 增加 
行为 。 此 时 ， 可 以 通过 定义 一 系列 视点 组 成 动画 的 路 线 ,并 加 闪 检 测 传感器 和 插 补 器 与 用 户 
交互 。 

(4) 修改 和 测试 。 修 改 模型 、 纹 理 、 动 画 和 视点 看 是 否 还 可 增加 其 他 特性 ， 如 HTML 
页 、 顶 点 颜色 、 材 质 等 ， 并 对 所 建立 的 世界 进行 试验 ， 以 保证 较 好 的 演 染 效果 和 速度 。 





8.9 使 用 VRML 2.0 构造 虚拟 世界 


8.9.1 VrmlPad 简介 


VrmlPad 是 Parallél Griphics 公司 出 品 的 VRMEL 开发 工具 , 具有 强大 的 本 地 远程 文件 编辑 
功能 、 方 便 的 树 形 结构 显示 、 功 能 强大 的 发 布 向 导 ， 对 其 他 语言 编写 的 应 用 程序 具有 良好 的 
包容 性 。VrmlPad 的 工作 界面 如 图 8.22 所 示 ! 


图 awrl -YrmlPad2.1 joyk 汉 化 版 [未 注册 版 ] = 对 
文件 E) 丹 印 (5 视图) 调式 D) 工具 (D 帮助 (H) 


DB 日 和 | 有 | || 辐 国 团 | 的 | 心 入 污 | 证 刘 |#| 国 摧 % 


























EE | 
4 Vewpont vewl 
国 postion de viewl” 
descrption } 
因 4 Vewpont vew? DEF viev2 Viewvpoint { 
国 Gop 0.20 
“iee2" 























路径 图 
资源 "| 
文件 列 谨 PEIKIONE FTE UL | sf 
准备 [m1 cq1 所 bye 卫 寺 陆 允 大 字 降 林 隐 于 
图 8.22 ”VrmlPad 的 工作 界面 
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人 多 娠 傈 找 术 坟 黄 应 用 (第 县 ) 


VrmlPad 环境 分 为 两 个 工作 区 ， 左 边 工作 区 显示 的 是 场景 的 树 形 结构 图 ， 右 边 的 工作 区 
为 代码 编辑 区 ， 主 要 用 于 代码 的 输入 。 若 单 击 “ 场 景 树 ”按钮 ， 则 在 左边 的 工作 区 显示 场景 





















































的 树 形 结构 图 。 单 击 “ 文 件 列表 ”按钮 ， 则 在 左边 的 工作 区 显示 当前 目录 下 的 文件 列表 。 单 
击 “ ”按钮 ， 则 在 右边 的 工作 区 显示 编辑 代码 的 .class 文件 。 

















8.9.2 使 用 VRML2.0 











VRML 2.0 是 一 种 基于 节点 的 建 模 语言 。 它 拥有 丰富 的 节点 , 可 以 通过 这 些 节点 来 构造 虚 
拟 世 界 中 的 各 种 形体 及 效果 ， 下 面 对 VRML 2.0 常用 的 节点 进行 简单 的 介绍 。 

1， 利用 节点 构建 静态 形体 

现在 使 用 VRML2.0 来 构建 一 个 由 圆锥 、 球 体 和 立方 体 组 成 的 静态 形体 组 合 。 在 VrmlPad 
中 输入 如 下 文字 。 


#VRML V2.0 utf8 Ze 
a 4 


Group { children [Shape { geometry Box {}) 







































第 一 行为 VRML 文件 的 标志 。#” 表 示 该 行为 注释 \V2.0 表示 该 文件 使 用 的 是 VRML 2.0 
版 本 ， 而 utf 8 则 表示 此 文件 采用 utf8 编码 方案 。 









第 二 行使 用 Group 语句 定义 了 组 节点 。 在 -VRML 文件 中 ,利用 组 节点 可 以 把 虚拟 场景 组 
织 成 条 理 清晰 的 树 形 分 支 结构 ， 组 节点 的 花 括 二 的 所 有 内 全 的 约 -个 整体 。 组 和， 点 所 包 
含 的 对 象 可 以 在 其 children 域 (孩子 域 ) 中 定义 。 ， 我 们 定义 了 一 个 Shape 节点 态 
利用 Shape 节点 ， 可 以 描述 形体 Wo 等 特征 六 Shape 节点 内 定义 的 是 一 个 
Box( 长 方 体 节点 )。 由 于 没有 为 Box 定义 任何 域 ， 故 它 的 所 有 特性 取 默 认 值 。 


将 上 述 文件 保存 为 “盒子 :wrl”。 图 8.23 是 用 浏览 器 看 到 的 效果 图 。 
本 
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图 8.23 ”用 浏览 器 看 到 盒子 .wrl 的 效果 图 
可 以 利用 Shape 节点 的 appearance 域 (外 观 域 ) 来 改变 盒子 的 外 观 。appearance 域 是 一 
Appearance 节点 ， 其 material 域 (材质 域 ) 定 义 为 一 个 Material 节点 。 
appearance Appearance { material Material {} } 
Material 节点 的 diffuseColor 域 ( 漫 射 色 ) 用 来 表达 形体 的 颜色 。VRML 的 颜色 说 明 采 用 的 
是 RGB 颜色 模型 ， 分 别 用 3 个 0 到 1 之 间 的 数字 表示 ， 依 次 是 红色 、 绿 色 和 蓝 色 。 要 让 盒子 
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的 外 表 呈 现 红色 ， 可 以 让 diffuseColor 域 的 取 值 为 {1 00}。 故 而 得 到 如 下 代码 。 


#VRML V2.0 utf8 

Group { children [ Shape { 

appearance Appearance { 

material Material { diffuseColor 1 00}} 
geometry Box {} } ] } 


其 效果 如 图 8.24 所 示 。 


Ver ai 
xm EE Fe In Wm 攻 国 
Ds en SW ™ 








图 8;24 红色 的 盒子 





在 浏览 器 中 ， 红 色 盒 子 位 于 屏幕 的 中 心 。 若 想 改变 它 的 位 置 ， 可 以 通过 Transform( 变 换 
节点 ) 来 实现 。 在 VRML 中 ，Transf6rm 节点 除了 具有 ;Group 节点 相似 的 功能 外 ， 还 可 以 对 形 
体 进行 平移 、 旋 转 和 缩放 。 例 如 ,> 要 把 上 述 形体 向 右 平移 8 个 单位 ， 可 以 将 Transform 节点 的 
translation 域 (平移 域 ) 设 置 为 800。 

更 改 后 的 代码 如 -Rs 

#VRML V2 SO” ut £8 


Group { children [ Transform { 








translation 8 0 0 
children [ 
Shape { appearance Appearance { material Material { diffuseColor 1 00}}1 


geometry Box {} }] } ] } 
用 类 似 的 方法 添加 其 他 形体 ， 如 球 和 圆锥 ， 得 到 如 下 代码 。 


#VRML V2.0 utf8 





Group { children [ 

Transform { translation 8 0 0 

children [ 

Shape { appearance Appearance { material Material { diffuseColor 1 00}} 
geometry Box {} } ] } 

Transform { translation 0 0 0 

children [ 

Shape { appearance Appearance { material Material { diffuseColor 010}} 


geometry Sphere {} } ] } 
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Transform { translation -8 0 0 

children [ 

Shape { appearance Appearance { material Material { diffuseColor 001}} 
geometry Cone {} } ] } ] 

} 


为 了 方便 以 后 的 引用 ， 可 以 使 用 DEF 语句 分 别 为 这 3 个 形体 命名 ， 进 而 得 到 如 下 代码 。 


#VRML V2.0 utf8 

Group { children [ 

DEF B Transform { translation 8 0 0 

children [ 

Shape { appearance Appearance { material Material { diffuseColor 1 00}} 
geometry Box {} } ] } 

DEF S$S Transform { translation 0 0 0 | 入 
children [ 


Shape { appearance Appearance { material MateriaT { diffuseColor 010}} 


geometry Sphere {} } ] } Ep |)— 
DEF C Transform { translation -8 0 .0 ， 
children [ 
Shape { appearance Appearance { material Material { diffuseColor 001} 
geometry Cone { } } ]} 和 N 

] A 三 


图 8.25 显示 出 由 3 个 形体 构成 的 场景 。 





EE 











国 





8.25 ”3 个 形体 构成 的 场景 





2. 让 形体 具有 交互 的 能 

VRML 2.0 最 突出 的 特点 就 是 交互 。 要 让 形体 有 具有 交互 能 力 ， 可 以 使 用 检测 器 (Senson) 节 
点 、 观 察 点 节点 和 传递 机 见 。 下 面 分 别 进行 简单 的 介绍 。 

1) 检测 器 节点 

在 VRML 2.0 中 , 交互 的 基础 是 检测 器 节点 。 它 一 般 存在 于 其 他 节点 的 children 域 中 , 其 
上 一 级 节点 被 称 为 可 触发 节点 。 检 测 器 节点 共有 9 种 ， 用 以 确定 不 同 的 触发 条 件 和 时 机 ， 应 
用 在 不 同 的 场合 。 





8 
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在 所 有 的 检测 器 节点 中 ，TouchSensor (接触 检测 器 ) 节 点 较为 常用 。 下 面 的 代码 中 ， 就 为 
Group 节点 定义 了 一 TouchSensor 节点 。 其 中 ，Group 节点 被 称 为 可 触发 节点 。 由 于 TouchSensor 
节点 的 存在 ， 使 得 用 户 可 以 通过 某 种 触发 操作 引起 场景 的 变化 。 





2) 观察 点 节点 XA 

在 康 拟 环境 中 ， 用 户 的 观察 点 (Viewpoin0) 位 置 或 视角 可 以 通过 转动 刀 标 或 按 箭 头 键 来 动 
态 调整 ,也 可 以 由 创作 者 通过 在 虚拟 场景 的 重要 位 置 设置 -Viewboint 节点 来 给 出 。 在 下 面 的 代 
码 中 ， 便 为 场景 定义 了 两 个 Viewpoint 节点 ， 分 别 为 viewl 和 view2。 






通过 viewl 和 view2 节点 ， 用 户 的 观察 点 可 以 方便 地 在 场景 中 的 00 10 位 置 和 42 10 位 
置 之 间 进行 切换 。 在 Cosmo 播放 器 中 ， 观 察 点 的 名 称 “view1” 和 “view2” 在 浏览 器 中 提供 
出 以 备用 户 选择 。 

3) 事件 路 由 传递 机 制 

在 场景 中 ， 除 节点 构成 的 层次 体系 外 ， 还 有 一 个 “事件 体系 ”， 事 件 体系 由 相互 通信 的 节 
点 构成 。 节 点 通过 事件 入 口 (eventIn) 接 收 事件 ， 通 过 事件 出 口 (eventOut) 发 送 事 件 。 事 件 入 口 
与 事件 出 口 拥有 类 型 。 若 节点 要 接收 多 种 类 型 的 事件 (入 事件 )， 就 应 具备 多 个 事件 入 口 。 

事件 出 口 和 事件 入 口 通过 ROUTE( 路 由 ) 语 句 来 联系 ， 从 而 构成 整个 事件 体系 。ROUTE 
语句 是 VRML 文件 中 除 节点 以 外 的 另 一 基本 组 成 部 分 。 例 如 ， 要 把 接触 检测 器 touchSensor 
的 事件 出 口 isActive 连接 到 观察 点 节点 view2 的 事件 入 口 set_bind, 可 以 编写 ROUTE 语句 如 下 。 
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OO touchsensor.isActive TOview2.set bing 
将 这 条 语句 加 在 文件 的 末尾 ， 得 到 如 下 的 VRML 文件 。 





在 该 场景 中 ， 如 果 把 鼠标 指针 指向 红色 全 了 泊 按 下 民 标 左 键 将 会 发 现 观察 点 已 经 变 为 
view2， 再 松 开 鼠 标 左 键 ， 场 景 被 恢复 、 这 主要 是 由 于 按 下 鼠标 左 键 时 ， 接 触 检测 器 被 俐 发 。 
它 从 事件 出 口 isActive 送出 一 个 ee 这 个 事件 通过 路 由 进入 节点 view2 的 事件 入 口 
set_bind， 从 而 使 得 view2 成 将 当前 视点 。 松 开 鼠标 祥 接 触 检测 器 向 view2 发 送 了 一 个 
FASLE 事件 ，view2 不 再 是 当前 观察 点 ， 场 景 这 一 功能 被 称 之 为 观察 点 加 距 。 
。 使 用 脚本 节点 定义 行为 

Tn a 己 定义 行为 。 Java 和 Javascript 
rN CAseripb 是 VRML 2.0 支持 的 两 种 脚本 描述 语言 。 VRML 2.0 标准 中 定义 
了 它们 和 VRML 的 接口 方法 。 











将 前 面 的 路 由 进行 修改 ,在 接触 检测 器 touchSensor 和 观察 点 节点 view2 之 间 插 入 一 个 脚 
本 节点 touchscript 来 定义 指定 的 行为 ， 代 码 如 下 。 





脚本 节点 touchscript 的 代码 如 下 。 





该 脚本 节点 通过 事件 入 口 ttuchSensorIsActive 接收 来 自 接触 检测 器 touchSensor 的 事件 ， 
经 过 处 理 后 再 把 结果 通过 事件 出 口 bindView2 发 送 给 观察 点 节点 view2。 





使 用 script 节点 ， 需 要 注意 几 个 问题 : 首先 , 脚本 节点 的 事件 入 口 和 事件 出 口 可 以 自己 定 
义 ， 而 其 他 VRML 节点 的 域 和 事件 都 是 固定 的 ; 其 次 ， 路 由 将 事件 从 一 个 节点 的 事件 出 口传 
递 给 另 一 个 节点 的 事件 入 口 。 此 时 的 事件 入 口 与 事件 出 口 的 类 型 必须 相同 ， 再次， 在 脚本 节 
点 的 域 “url” 中 ， 既 可 以 直接 包含 脚本 ， 也 可 以 包含 一 个 或 多 个 用 URL 地 址 指示 的 脚本 ( 若 
指示 的 地 址 有 多 个 , 则 按 次 序 的 先后 获取 第 一 个 可 得 到 的 脚本 ); 最 后 , 若 脚本 以 函数 (function) 
形式 给 出 ， 则 函数 名 必须 与 事件 入 口 的 名 称 相 同 ， 表 示 相 应 事件 入 口 收 到 事件 后 调用 此 函数 
进行 处 理 ， 修 改 后 的 完整 代码 如 下 。 





3 场景 中 动画 的 实现 


现在 想 在 单 击 盒子 时 ， 让 盒子 旋转 ， 该 如 何 实现 呢 ? TouchSensor 节点 (接触 检测 器 )、 
TimeSensor 节点 (时 间 检 测 器 ) 和 插 补 器 可 以 实现 这 一 行为 。 

1) 使 用 接触 检测 器 ， 结 合 脚本 节点 实现 动画 

通过 接触 检测 器 触发 脚本 节点 。 在 脚本 节点 中 ， 不 断 修改 旋转 值 ， 并 传递 给 形体 节点 的 
事件 入 口 rotation， 可 以 实现 盒子 的 旋转 动画 。 给 出 代码 如 下 。 








在 该 代码 中 ,盒子 box 的 类 型 是 Transform 节点 ， 它 拥有 外 器 姑 ( 既 可 作为 入 事件 被 修改 ， 
也 可 作为 出 事件 输出 的 域 )rotation 域 ， 用 来 指定 该 节点 相对 LE 层 玲 标 系 的 旋转 值 。 Rotation 
域 的 值 由 4 个 数值 构成 ， 前 3 个 数值 用 来 定义 旋转 轴 ， 最 后 1 数值 用 来 确定 旋转 角 。 上 述 
代码 将 旋转 轴 定 义 为 2 2 2， 并 利用 脚本 节点 不 断 修改 施 ; 

使 用 浏览 器 浏览 时 ， 如 果 将 鼠标 指针 移动 到 愈 对 之 上 ， 接触 检测 器 发 出 isOver 事件 ， 并 
通过 路 由 传递 给 脚本 节点 的 事件 入 品 startRevolving, 从 而 启动 函数 startRevolving。 通过 该 









2) 使 用 时 间 检测 器 ， 结 合 脚本 节 江 现 动画 
为 了 让 盒子 能 够 连续 地 旋转 需要 在 固定 的 时 间 疝 隔 内 不 断 地 修改 盒子 的 旋转 角 ， 这 便 
需要 TimeSensor 节点 (时 间 检 测 器 ) 的 帮助 。 TimeSens6r 节点 能 够 随 着 时 间 推 移 不 断 产生 事件 ， 
用 于 如 驱动 连续 性 的 仿真 和 动画 ， 控制 周期 性 的 湛 动 ， 初始 化 单独 事件 等 目的 。 使 用 时 间 检 
测 器 修改 路 由 如 下 。 人 > 





当 鼠 标 指 针 移动 到 盒子 之 上 时 ， 接 触 检测 器 TouchS 发 出 isOver 事件 ， 通 过 路 由 传递 给 
时 间 检 测 器 t 的 事件 入 口 set_enabled, 使 其 开始 工作 (时 间 检 测 器 的 域 enabled 的 值 由 FALSE 
变 为 TRUE)。 时 间 检 测 器 t 每 隔 0.2s 送出 一 个 cycleTime 事件 ,从 而 引发 节点 r 的 startRevolving 
事件 ,驱动 盒子 的 旋转 。 为 了 让 事件 入 口 与 事件 出 口 类 型 一 致 , 这 里 需要 将 r 的 startRevolving 
事件 类 型 改 为 SFTime， 下 面 给 出 完整 的 代码 。 








3) 使 用 插 补 器 ， 结 合 时 间 检测 器 实现 动画 Nl 

盒子 的 旋转 也 可 以 使 用 插 补 器 来 实现 。 在 VRML 合用 插 补 器 节点 可 以 方便 地 实现 关键 
帧 动画 。 插 补 器 节点 共有 6 个 : CoordinateInterpolatotf 至 标 插 补 器 )、 ColorInterpolator( 颜 色 插 补 
器 )、positionInterpolator( 位 置 插 补 器 )、 Normalinierpolator( 法 线 插 补 器 )、 ScalarInterpolator( 标 量 
插 补 器 )、 OrientationInterpolator( 明 向 质 补 妖 )。 这 些 通常 配合 时 间 检 测 器 或 能 够 使 对 象 产生 动 
作 的 节点 生成 关键 帧 动画 。 SN 

所 有 插 补 器 部 有 类 似 的 城 和 寺 伦 ) ;如 eventin SPFFloat Net -action 、 eventout [SIMJF<type> 
value_changed、exposedField MF<type> keyValue [… 区 VexposedFicld MFFloat key […]。 

关键 值 域 keyValue 的 奖 型 次 定 了 插 补 器 的 类 型， 入 事件 set_fraction 接收 SFFloat 型 的 事 
件 ， 插 补 器 根据 它 进行 插 信 ， 并 通过 出 事件 walie zhanged 送出 插值 结果 。 

下 面 利用 tafionInterpolator( 朝 向 播 补品) 实现 盒子 的 旋转 。 为 了 使 盒子 在 固定 的 时 间 
间隔 内 改变 旋转 角度 ， 还 需要 时 间 检 测 器 的 配合 。 将 时 间 检 测 器 的 fraction_changed 事件 作为 
朝向 插 补 器 事件 入 口 set_fraction 的 输入 ,再 通过 朝向 插 补 器 的 事件 出 口 value_changed 修改 全 
子 的 rotation 域 的 值 ， 从 而 达到 让 盒子 旋转 的 目的 。 由 于 时 间 检 测 器 的 事件 出 口 
fraction_changed 为 [0.1] 的 值 ， 表 明 当 前 周期 内 已 过 去 的 时 间 占 整个 周期 的 比值 ， 所 以 需要 将 
插 补 器 关键 帧 的 取 值 key 也 定义 在 [0.1] 范 围 内 。 为 了 让 盒子 绕 着 固定 的 旋转 轴 旋 转 ， 我 们 将 
关键 帧 取 值 key 所 对 应 的 关键 值 的 旋转 轴 设 为 相同 ,将 旋转 角 分 别 设 为 0、3.14159 和 6.28318， 
表明 盒子 的 旋转 角 从 0 变化 到 3.14159 再 变化 到 6.28318， 如 此 反复 ， 完 整 代码 如 下 。 

















多 媒体 技术 及 其 详 用 (第 之 版 ) 


DEF r OrientationInterpolator { 

key [0,0.5,1] 

keyValue [ 0.8 0.8 0.8 0,0.8 0.8 0.8 
3.14159,0.8 0.8 0.8 6.28318] } 

ROUTE TouchS.isOver TO t.set enabled 
ROUTE t.fraction changed TO 

r.set fraction 


ROUTE r.value changed TO box.set rotation 
生成 效果 如 图 8.26 所 示 。 
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图 8.26 “旋转 动画 效果 图 
8.10 小 结 


虚拟 现实 技术 是 二 种 多 学 科 交 叉 的 新 兴 技 术 ， 开 创 并 带动 了 一 系列 新 的 研究 方向 ， 而 且 
在 许多 方面 成 功 地 应 用 ， 形 成 了 虚拟 现实 软 硬 件 和 应 用 产业 ， 成 为 国际 前 沿 的 研究 方向 之 一 
目前 虚拟 现实 技术 尚 不 成 训 潮 形 成 不 久 ， 作 为 虚拟 现实 技术 的 核心 一 一 计算 机 图 形 
学 在 我 国有 较 好 的 设备 条 件 和 研究 工作 积累 ， 为 赶 超 国际 水 平 打 下 良好 基础 。 

本 章 主 要 介绍 了 虚拟 现实 技术 的 定义 和 特点 ， 虚 拟 现实 技术 的 分 类 情况 ， 关 键 技术 和 应 
用 方向 。 另 外 ， 从 实用 角度 出 发 ， 介 绍 了 虚拟 现实 建 模 语言 (VRML)。 通 过 本 章 的 学 习 ， 能 了 
解 虚拟 技术 的 基本 发 展 情况 ， 并 能 独立 建立 虚拟 现实 世界 。 












8.11 习 题 
1， 填 空 题 
(1) VRML 是 指 
(2) 导致 的 原因 是 用 户 对 计算 机 环境 的 虚拟 物体 产生 了 类 关 似 于 现实 物体 的 存在 意 





















识 或 幻觉 ， 沉 浸 感 必须 具备 3 个 要 素 ， 它 们 分 别 是 、 和 
(3) 从 虚拟 现实 与 外 界 的 交互 考虑 可 以 分 成 3 类 : 、 和 








(4) 虚拟 现实 软件 是 提供 实时 观察 和 参与 虚拟 环境 能 力 的 软件 系统 ， 包 括 
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4 个 方面 。 























(5) 无 论 是 桌面 虚拟 现实 系统 还 是 临 境 虚拟 现实 系统 , 它们 都 、 虚 拟 现实 软件 、 
虚拟 现实 硬件 (包括 计算 机 、 虚 拟 现实 输入 /输出 设备 )3 部 分 组 成 。 
2. 选择 题 
(1) 下 面 不 是 虚拟 现实 特点 的 是 。 
A. 沉浸 感 B. 娱乐 性 C. 交互 性 D. 构想 性 





(2) 在 VRML 语言 中 , 事件 出 口 和 事件 入 口 通过 _ 相连, 它 是 VRML 文件 中 除 节点 以 
外 的 另 一 基本 组 成 部 分 






































A. 路 B. eventIn 语句 C. Sensor 节点 D. Group 节点 
(3) VRML 文件 至 少 需要 版 本 与 字符 集 说 明 (例子 中 的 第 一 行 语句 ), 其 文件 主要 由 ”构成 。 
A. JavaScript 语句 B. Windows 类 c: 节点 I D，Java 语言 
3， 判 断 题 < 
(D VRML 1.0 最 突出 的 特点 就 是 交互 性 。 人 人 
(2) 所 有 的 虚拟 环境 都 是 完全 脱离 现实 世界 的 ( ) 




















(3) 庶 拟 现实 最 主要 的 技术 是 沉 漫 感 , 成 挫 岗 ， 术 追 求 的 目标 也 就 是 力求 使 用 户 在 计算 


机 所 创建 的 三 维 虚拟 环境 中 处 于 一 种 “SX 的 感觉 状态 ， 有 身 临 其 境 的 感觉 ， 即 沉 
NANN 


浸 感 。 人 
4， 简 答题 人 入 v“ 激 
(1) 什么 是 虚拟 现实 技术 ?全 XL 


(2) 虚拟 现实 系统 的 分 类 及 其 组 成 是 什么 ? AS 红 
(3) 虚拟 现实 的 关键 技术 有 哪些 ? 5 


(4) ee 在 什么 领域 ? > 
(5) 虚拟 现实 的 硬件 设备 有 哪些 ? 


(6) 如 何 使 用 VRML 2.0 构建 虚拟 世界 ? 
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第 9 草 。 多 媒体 通信 


教学 提示 


Pe 

> 多 媒体 通信 除了 满足 一 般 意 头 的 多 媒体 信息 处 理 的 基本 要 求 外 ， 特 
别 需要 满足 网 络 环境 下 的 交互 性 、 实 时 性 和 同步 性 要 求 。 多 媒体 通信 
技术 的 最 终 目 标 是 在 满足 多 媒体 通信 服务 质量 条 件 下 的 多 媒体 通信 。 

教学 目标 

mam 

> :本章 主 要 介绍 多 媒体 通信 的 枯 本 知识 ， 使 初学 者 对 多 媒体 通信 有 一 
个 全 面 的 了 解 。 通过 本 章 的 学 习 ， 要 求 掌握 多 媒体 通信 的 基本 特点 、 
关键 技术 ， 以 及 常见 的 几 种 多 媒体 通信 网 络 、 几 种 典型 的 多 媒体 通 
信和 系统 和 相关 的 通信 标准 与 协议 。 


9.1 多 媒体 通信 概述 





如 果 说 19 世纪 是 电报 时 代 ，20 世纪 是 电话 时 代 ， 那 么 21 世纪 就 是 多 媒体 通信 时 代 。 随 
着 技术 的 迅速 发 展 ， 图 像 、 视 频 等 多 媒体 数据 已 逐渐 成 为 信息 处 理 领 域 中 主要 的 信息 媒体 形 
式 。 多 媒体 通信 是 信息 高 速 公路 建设 中 的 一 项 关键 技术 。 它 是 近年 来 出 现 的 一 种 新 兴 的 信息 
技术 ， 是 多 媒体 、 通 信 、 计 算 机 和 网 络 等 相互 渗透 和 发 展 的 产物 。 多 媒体 通信 的 广泛 应 用 将 
会 极 大 地 提高 人 们 的 工作 效率 ， 减 轻 社会 的 交通 运输 负担 ， 改 变 人 们 的 教育 和 娱乐 方式 。 多 
媒体 通信 将 成 为 人 们 通信 的 基本 方式 ， 是 目前 各 国 在 通信 、 计 算 机 、 教 育 、 广 播 娱乐 等 各 个 
领域 研究 的 前 沿 课题 。 


9.1.1 多 媒体 通信 的 发 展 背景 


eta 给 80 年 代 初 ， 美 国 、 日 
odd sm re 把 该 技术 应 用 于 PC。 首 先 建立 
了 基于 局 域 网 的 多 媒体 通信 系统 。 自 20 世纪 90 年 多 媒体 计算 机 技术 就 成 为 计算 机 
领域 的 热点 之 一 。 计 算 机 在 各 个 领域 中 的 广泛 应 应 用 全 人 类 可 以 获取 的 信息 爆炸 性 地 增长 ， 
人 居多 凶 人 人 中 的 “ 允 旨 作 " 届 ， 拓 媒体 计算 机 技术 便 自然 而 然 地 出 现 并 迅速 
发 展 起 来 。 多 媒体 通信 中 的 “多 媒体 ” 的 是 由 在 内 容 上 相互 关联 的 文本 、 图 形 、 图 
像 、 音 频 和 视频 等 媒体 数据 构成 的 一 种 4 eas ee -种 媒 
体 进行 表示 、 存 储 、 传输 和 处 理 ? 沽 上 将 这 些 不 同类 型 的 据 有 机 地 合成 在 一 起 ， 形 成 
多 媒体 数据 ， es eT 多 媒体 计 丢 术 综合 和 发 展 了 计算 机 科学 中 的 多 
种 技术 ， 如 操作 系统 、 计 算 机 通信 、 数 字 信号 和 SS 
















































































文 、 声 、 你 技术 放 > f 科 学 技术 的 迅速 发 展 和 社会 需求 的 日 益 
增长 ， 人 们 已 不 局 一 媒体 提供 的 传 本 划一 服务 ， 如 电话 、 电 视 、 传 真 等 ， 而 是 需要 
诸如 数据 、 文 本 、 图 像 、 音 频 和 视频 等 多 种 媒体 信息 以 超越 时 空 限制 的 集中 方式 作为 





St 在 这 种 时 代 背 景 下 ， 伴 随 着 多 媒体 计算 机 技术 与 电话 、 广 播 、 
电视 、 微 波 、 卫 星 通信 、 广 域 网 (Wide Area Network，WAN) 和 局 域 网 等 各 种 通信 技术 相 结合 ， 
产生 了 一 种 边缘 性 技术 一 一 多 媒体 通信 。 


9.1.2 ”多 媒体 通信 的 特点 


多 媒体 通信 (Multimedia Communications) 是 多 媒体 技术 与 通信 技术 的 完美 结合 , 突破 了 计 
算 机 、 通 信 、 电 子 等 传统 领域 的 界限 ， 把 计算 机 的 交互 性 、 通 信 网 络 的 分 布 性 和 多 媒体 信息 
的 综合 性 融 为 一 体 ， 多 媒体 对 通信 的 影响 主要 表现 在 以 下 几 个 方面 。 

。 多 媒体 通信 数据 量 巨大 

于 多 媒体 数据 的 量 很 大 ， 存 储 空间 要 求 大 ， 传 输 带 宽 要 求 高 ， 就 不 可 避免 地 要 对 所 传 
输 的 数据 进行 压缩 。 而 现在 的 高 倍率 的 压缩 以 损失 原始 数据 信息 量 为 代价 ， 这 影响 到 媒体 本 
身 的 质量 。 在 很 多 情况 下 ， 就 不 得 不 考虑 静态 、 慢 速 或 小 画面 等 办 法 来 限制 数据 量 ， 这 也 影 
响 通信 和 质量。 因此， 真正 实现 多 媒体 通信 ， 必 须 加 大 带宽 ， 使 得 通信 网 络 能 适应 多 媒体 数据 
量 的 增长 。 
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2. 多 媒体 通信 的 实时 性 


多 媒体 中 的 声音 、 动 画 、 视 频 等 媒体 对 多 媒体 传输 设备 的 要 求 很 高 ， 即 使 带宽 充足 ， 如 
果 通 信 协 议 不 合适 ， 也 会 影响 多 媒体 数据 的 实时 性 。 例 如 ， 在 语音 通信 时 ， 不 要 去 纠正 偶尔 
风 误 码 效果 要 比 由 于 纠 错 重 发 而 发 生 的 语音 停顿 要 好 得 多 。 一 般 来 说 ， 电 路 交换 方式 延迟 短 ， 
但 占用 专门 信道 ， 不 易 共享 ， 而 分 组 交换 方式 则 延迟 偏 长 ， 且 不 适 于 数据 量变 化 大 的 业务 人 
。 很 显然 ， 这 将 要 求 通信 网 、 通 信 协 议 及 高 层 协议 能 适应 这 种 需求 。 
实时 性 的 影响 还 存在 于 端 端 延迟 上 ， 在 多 媒体 数据 传输 中 ， 许 多 处 理 环节 都 会 增加 端庄 
延迟 。 鉴 于 各 种 多 媒体 之 间 的 特性 如 此 不 一 致 ， 一 般 采用 “服务 质量 ”(Quality of Service，QoS) 
来 描述 ， 传 输 时 也 往往 根据 QoS 来 决定 传输 策略 。 例 如 ， 对 语音 可 采取 延迟 短 、 延 迟 变 化 小 
的 传输 策略 ， 对 数据 传输 则 可 采用 可 靠 、 保 序 的 传输 策略 等。 
3， 多 媒体 通信 的 同步 性 入 


站 
户 要 检索 一 个 重要 的 历史 事件 的 片断 ， 该 事件 的 运动 图 像 [或 静止 图 像 ) 存 放 在 图 像 数据 库 
中 ， 其 文字 叙述 和 语言 说 明 放 在 其 他 数据 库 中。 多 媒体 通信 侨 端 通过 不 同 传输 途径 将 所 需要 
信息 从 不 同 的 数据 库 中 提取 出 来 ， 关 将 这 些 声音 图 像 、 文 字 同步 起 来 ， 构 成 一 个 整体 的 
信息 里 现 在 用 户 面前 ， 合 声音、 图像 、 文 富 实现 同步， 状 将 同步 的 信息 送 给 用 户 。 
系统 还 是 多 种 媒体 通信 系统 。 此 外 》 风 媒体 通信 的 同步 性 也 是 较 难 的 技术 问题 之 一 ， 一 般 来 
说 ， 多 媒体 通信 系统 是 一 个 资源 受 限 A 两 种 情况 ， 也 就 是 通信 速率 














































































































受 限 和 终端 内 存 受 限 。 如 果 这 两 个 方面 没有 限制 ， 同 本 来 不 会 有 很 大 的 技术 难点 。 例 如 ， 
如 果 信道 通信 速率 不 受 限 , 那么 只 要 发 送 端 完全 安排 好 信息 媒体 间 的 关系 ， 在 接收 端 就 完全 
忠实 地 复 现 出 来 ， 信 息 同 步 将 不 成 问题 ， 当 然 在 信道 的 通信 速率 受 限 的 情况 下 ， 接 收 端的 信 
息 间 同步 就 要 困难 得 多 。 另 外 ， 如 果 接收 端 存储 器 的 存储 容量 是 无 限 的 ， 将 所 有 信息 全 部 接 
收 下 来 ， 然 后 在 终端 内 同步 播 出 ， 在 这 种 场合 下 同步 问题 也 容易 解决 ， 但 实际 上 这 个 条 件 是 
无 法 满足 的 ， 因 而 使 同步 问题 变 得 很 困难 。 

4. 多 媒体 通信 的 交互 性 

多 媒体 系统 的 关键 特点 是 交互 性 。 这 就 要 求 多 媒体 通信 网 络 提供 双向 的 数据 传输 能 力 
这 种 双向 传输 通道 从 功能 和 带宽 来 讲 都 是 不 对 称 的 。 

5. 分布 式 处 理 和 协同 工作 


目前 的 通信 网 络 状况 是 多 网 共存 ， 在 未 来 的 通信 系统 中 ， 多 网 统一 、 业 务 综合 和 多 媒体 
化 应 是 发 展 的 重点 。 现 有 的 各 类 信息 网 络 ， 包 括 电话 网 、 计 算 机 网 ， 甚 至 电视 网 、 广 播 网 和 
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面 对 用 户 。 为 了 达到 这 个 目标 ， 在 高 速 宽 带 的 网 络 上 ， 实 现 各 种 多 媒体 信息 的 传输 就 非常 必 

















分 布 式 处 理 是 向 用 户 提供 综合 服务 的 基本 方法 。 因 为 多 媒体 引入 到 了 分 布 式 处 理 领域 后 ， 
不 仅仅 是 各 通信 传输 的 问题 ， 还 有 许多 建立 在 通信 传输 之 上 的 分 布 式 处 理 与 应 用 问题 需要 研 
究 。 需 要 解决 : 各 项 多 媒体 应 用 在 分 布 式 环 境 下 运行 时 ， 如 何 通过 分 布 式 环境 解决 多 点 多 人 
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第 9 章 


| 
合作 问题 ， 以 及 如 何 提供 远程 的 多 媒体 信息 服务 等 问题 。 
9.1.3 ”多 媒体 通信 的 关键 技术 


多 媒体 通信 的 关键 技术 主要 有 以 下 几 种 。 

(1) 声音 、 视 频 、 图 像 等 多 媒体 信息 处 理 技术 。 
(2) 数据 压缩 和 解压 缩 技术 。 

(3) 多 媒体 信息 实时 传输 与 同步 技术 。 

(4) 多 媒体 通信 协议 与 标准 化 。 





9.2 多 媒体 通信 和 网络 
随 着 多 媒体 技术 的 发 展 及 多 媒体 应 用 的 不 断 深化 ， 大 量 数字 化 的 音频 和 视频 信息 震 要 统 
一 的 信息 网 络 来 传输 ， 通 过 高 速 网 络 实现 大 量 的 数字 化 数据 处 理 、 交 换 和 通信 ， 以 达到 相互 

间 的 共享 。 XN 
现 有 的 许多 通信 网 络 ， 他 们 的 设计 目的 多 样 、 用 途 络 异 ， 多 数 已 得 到 广泛 的 应 用 ， 包 括 
电话 交换 网 、Ethernet、FDDI、 分 组 交换 网 、 DN D、HFC 等 ， 它 们 分 别 属于 电信 网、 
计算 机 网 和 有 线 电视 网 。 这 些 网 络 之 间 已 存在 不 同 程度 的 交叉 与 融合 ， 但 是 要 使 这 些 不 同 的 
网 络 统一 起 来 还 为 时 过 早 。 下 面 以 电信 网 SY 计 机 网 和 有 线 电 视 网 为 分 类 ， 简 单 介绍 其 中 一 
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些 有 代表 性 的 网 络 。 NAN si 
9.2.1 基于 电信 网 的 多 媒体 信息 传输 以 祷 
办 2 
1. ISDN ,2 2 


ISDN(Integrated Service Digital Networ 钙 文 洛 称 是 综合 业务 数字 网 ， 通俗 地 称 为 “一 线 
通 ”。 目 前 电话 网 交换 和 中 继 已 经 基本 上 实现 了 数字 化 ， 即 电话 局 和 电话 局 之 间 从 传输 到 交换 
全 部 实现 了 数字 化 ， 但 是 从 电话 局 到 用 户 则 仍然 是 模拟 的 ， 向 用 户 提供 的 仍然 只 是 电话 这 一 
单纯 业务 。 综 合 业务 数字 网 的 实现 ， 使 电话 局 和 用 户 之 间 依 然 采用 一 对 铜 线 ， 也 能 够 做 到 数 
字 化 ， 并 向 用 户 提供 多 种 业务 ， 除 了 拨打 电话 外 ， 还 可 以 提供 诸如 可 视 电 话 、 数 据 通信 、 会 
议 电 视 等 多 种 业务 ， 从 而 将 电话 、 传 真 、 数 据 、 图 像 等 多 种 业务 综合 在 一 个 统一 的 数字 网 络 
中 进行 传输 和 处 理 。 

综合 业务 数字 网 有 罕 带 综合 业务 数字 网 (Narrowband-ISDN,N-ISDN) 和 宽带 综合 业务 数字 
网 (Broadband-ISDN，B-ISDN) 两 种 。 罕 带 综合 业务 数字 网 向 用 户 提供 的 有 基本 速率 (2B+D， 
144kb/s) 和 一 次 群 速率 (30B+D，2Mb/s) 两 种 接口 。 基 本 速率 接口 包括 两 个 能 独立 工作 的 B 信 
道 (64kb/s) 和 一 个 D 信道 (16kb/s)， 其 中 B 信道 一 般 用 来 传输 话音 、 数 据 和 图 像 ，D 信道 用 来 
传输 信 令 或 分 组 信息 。 宽 带 可 以 向 用 户 提供 155Mb/s 以 上 的 通信 和 能力。 

ISDN(2B+D) 具 有 普通 电话 无 法 比拟 的 优势 ， 其 优势 如 下 。 

(1) 综合 的 通信 业务 。 利 用 一 条 用 户 线路 ， 就 可 以 在 上 网 的 同时 拨打 电话 、 收 发 传真 ， 就 
像 两 条 电话 线 一 样 。 通 过 配置 适当 的 终端 设备 ， 用 户 也 可 以 实现 会 议 电 视 功能 ， 把 用 户 和 亲 
人 、 朋 友之 间 的 距离 缩 到 最 短 。 

(2) 高 速 的 数据 传输 。 在 数字 用 户 线 中 , 存在 多 个 复 用 的 信道 ， 比 现 有 电话 网 中 的 数据 传 
输 速 率 提高 了 2 一 8 倍 。 
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人 


失真 很 小 。 














要 使 用 的 








,9 适宜 的 费 


多 媒体 技术 及 其 应 用 (第 2 版 ) 
(3) 较 高 的 传输 质量 。 由 于 采用 端 到 端的 数字 
数据 传输 的 比特 误 码 特性 比 电话 线路 至 少 改善 了 10 倍 。 
(4) 使 用 灵活 方便 。 只 需 一 个 入 网 接口 ， 使 用 一 个 统一 的 号 码 ， 就 能 从 网 络 获得 用 户 所 需 









































各 种 业务 、 统 一 的 接口 。 























Ei 






































2. ADSL 


Internet 的 爆炸 式 发 展 ， 在 Internet 上 的 商业 应 用 和 多 媒体 等 服务 也 得 到 迅 独 推广 。 
要 享受 Internet 上 的 各 种 服务 , 用 户 必须 以 某 种 方式 接 入 网 络 。 为 了 实现 用 户 接 入 网 的 数字 化 、 


随 着 


宽带 化 ， 


户 网 的 成 本 过 高 ， rr 仍 





提高 用 户 上 网 速度 ， 


传输 ,传输 质量 得 以 明显 提高 。 接 收 端 声音 

















于 使 用 单一 的 网 络 来 提供 多 种 业务 ，ISDN 大 大 提高 了 网 络 资源 的 利 
廉 的 费用 向 用 户 提供 业务 ， 同时 用 户 不 必 购 买 和 安装 不 同 的 设备 和 线路 接 入 不 同 
因而 只 需要 一 个 接口 就 能 够 得 到 各 种 业务 ， 大 大 节省 了 投资 。 



































光纤 到 户 (FTTH) 是 用 户 网 今后 发 展 人 方向 ， 但 由 于 光纤 用 


使 用 现 有 的 铜 线 环 路 ， 


于 是 近年 来 人 们 提出 了 多 项 过 渡 性 的 宽带 接 入 网 技术 ， ISDN、 Cable Modem、 ADSL 
等 ， 其 中 ADSL 是 最 具 前 景 及 竞争 力 的 一 种 ， 将 在 未 i 占 主导 地 位 。 














它 包 括 H 


锯 量 大 致 
VDS 
的 一 种 ， 


高 性 价 比 
支持 上 行 





态 地 调整 
远程 局 域 


令 ) 要 多 得 多 。 





目前 


离 为 3 一 4km， 且 需要 2 一 4 对 铜 质 


DSL、SDSL、VDSL、ADSL 和 RA 


现在 信号 传输 速度 和 距离 的 不 同 ， 以 及 上 行 速率 下 行 速率 对 称 性 的 不 同 这 两 个 方面 。 

HDSL 与 SDSL 支持 对 称 的 TUEIC: 544Mb/s/2.048Mb/s) 传 输 。 其 中 HDSL 的 有 效 传输 距 
绞 电 话 线 ; SDSL 最 大 和 有 效 传输 距离 为 3km， 只 需 一 对 
铜 线 。 相 比 而 言 ， 对 称 DSL 更 3 用 于 企业 点 对 点 过 接应 用 ， 六 如 文件 传输 、 视 频 会 议 等 收发 数 
相应 的 工作 。 同 非 对 称 SL 相 比 ， 对 称 DS 这 的 市 场 要 小 得 多 。 
L、ADSL 和 有 ADSL 属于 非 对 称 式 传输 ,其 中 ， VDSL 技术 是 xDSL 技术 中 较 快 
在 一 对 铜 质 双 绞 电话 线 上 ， 上 得 数 据 的 速率 为 13 一 52Mb/s， 下 行 数据 的 过 
1.5 一 2.3 Mb 但 是 VDSL 的 传输 距离 只 4 在 几 百 米 以 内 ， VDSL 可 以 成 为 光纤 到 家 庭 的 具有 





替代 方案 ， 目前 深圳 的 VOD 就 是 采用 











户 的 访问 速度 。 正 是 RADSL 的 这 些 特 
网 络 访问 的 理想 技术 ， 因 为 在 这 些 应 用 

















ADSL 主要 提供 Internet 高 速 宽 带 接 入 





应 的 站 点 
入 还 将 可 
以 ADSL 

3. 3 











DSL(Digital Subscriber Line， 数 字 用 户 线路 ) 是 以 铜 质 话 线 为 传输 介质 的 传输 技术 组 合 ， 





L 等 ， 一般 称 之 为 xDSL。 它 们 主要 的 区 别 体 





为 








这 种 接 入 技术 实现 的 。ADSL 在 一 对 铜 线 上 


速率 640kb/s 一 1Mb/s， 下 行 速率 1 一 8Mb/s， 有 效 传输 距离 在 3 一 Skm。RADSL 能 够 
提供 的 速度 范围 与 ADSL 基本 相同 ， 但 它 可 以 根据 双 绞 铜 线 质量 的 优 劣 和 传输 距离 的 远近 动 

















点 使 RADSL 成 为 用 于 网 上 高 速 冲浪 ,VOD、 
bh 用 户 下 传 的 信息 往往 比 上 传 的 信息 (发 送 指 


和 服务， 用户 只 要 通过 ADSL 接 入 ,访问 相 











便 可 免费 享受 多 种 宽带 多 媒体 服务 。 随 着 ADSL 技术 的 进一步 推广 应 用 ，ADSL 接 
以 提供 点 对 点 的 远程 医疗 、 远 程 教学 、 远 程 电视 会 议 等 服务 。 业 界 许多 专家 都 坚信 ， 














为 主 的 xDSL 技术 终 将 成 为 铜 双 绞 线 上 
G 多 媒体 通信 


的 赢家 ， 并 最 终 实现 光纤 接 入 。 








第 三 代 移动 通信 技术 (3rd-generation，3G) 是 指 支持 高 速 数据 传 输 的 蜂窝 移动 通信 技术 。 
E 够 同时 传送 声音 (通话 ) 及 数据 信息 (电子 邮件 、 即 时 通信 等 )。3G 的 代表 特征 是 提供 


3G 服务 外 
高 速 数 据 


56 





业务 ， 速 率 一 般 在 几 百 Kb/s 以 上 。 





i i Es 

一 般 地 讲 ，3G 是 指 将 无 线 通 信 与 国际 互联 网 等 多 媒体 通信 结合 的 新 一 代 移 动 通信 系统 ， 
未 来 的 3G 必 将 与 社区 网 站 进行 结合 ，WAP 与 Web 的 结合 是 一 种 趋势 ， 如 时 下 流行 的 微 博 网 
站 等 就 已 经 将 此 应 用 加 入 进来 。 

1995 年 问世 的 第 一 代 模 拟 制式 手机 (1G) 只 能 进行 语音 通话 。1996 一 1997 年 出 现 的 第 二 代 
GSM、CDMA 等 数字 制式 手机 (2G) 便 增加 了 接收 数据 的 功能 ， 如 接收 电子 邮件 或 网 页 。3G 
与 2G 的 主要 区 别 是 传输 声音 和 数据 的 速度 的 提升 ，3G 能 够 在 全 球 范围 内 更 好 地 实现 无 线 漫 
游 ， 并 处 理 图 像 、 音 乐 、 视 频 流 等 多 种 媒体 形式 ， 提 供 包 括 网 页 浏览 、 电 话 会 议 、 电 子 商务 
等 多 种 信息 服务 ， 同 时 也 要 考虑 与 已 有 第 二 代 系 统 的 良好 兼容 性 。 为 了 提供 这 种 服务 ， 无 线 
网 络 必须 能 够 支持 不 同 的 数据 传输 速度 ， 即 在 室内 、 室 外 和 行车 的 环境 中 能 够 分 别 支持 至 少 
2Mb/s( 兆 比特 /每 秒 )、384kb/s( 千 比特 /每 秒 ) 及 144kb/s 的 传输 速度 (此 数值 根据 网 络 环境 会 发 生 
变化 )。 和 
3G 规范 是 由 国际 电信 联盟 所 制定 的 IMT-2000 规范 的 最 终 发 展 结果 。 原 先 制定 的 3G 远 
景 ， 是 能 够 以 此 规范 达到 全 球 通信 系统 的 标准 化 。 目 前 3GK 交 区 4 种 标准 : CDMA 2000、 
WCDMA、TD-SCDMA，WiMAX。 六 

1) WCDMA wa 下 三 

WCDMA(Wideband CDMA， 宽频 分 码 多 重 存 取 ), 也 称 为 CDMA Direct Spread， 意 为 宽 
频 分 码 多 重 存 取 ， 这 是 基于 GSM 网 发 展 出 来 的 3G 技术 规范 ， 是 欧洲 提出 的 宽带 CDMA 技 
术 , 它 与 日 本 提出 的 宽带 CDMA 技术 基本 相同 、 目前 正在 进一步 融合 。 WCDMA 的 支持 者 主 
要 是 以 GSM 系统 为 主 的 欧洲 厂商 \ 朋 本 公司 也 或 多 或 少 参 与 其 中 ， 包括 欧美 的 爱立信 、 阿 尔 
卡特 、 诺 基 亚 、 朗 讯 、 北 电 , 以 及 日 本 的 NTT、 富士 通 、 夏 普 等 广 商 。 该 标准 提出 了 GSM(2G)- 
GPRS-EDGE-WCDMA(3G) 的 演进 策略 。 这 套 系统 能 够 染 设 在 现 有 的 GSM 网 络 上 ， 对 于 系统 
提供 商 而 言 可 以 较 轻易 地 过 渡 。 预计 在 GSM 系统 相当 普及 的 亚洲 ,对 这 套 新 技术 的 接受 度 会 
相当 高 。 因此 WCDMA 具有 先天 的 市 场 优势 5 WCDMA 已 是 当前 世界 上 采用 的 国家 及 地 区 最 
广泛 的 、 终 端 种 类 最 丰富 的 一 种 3G 标准 ， 夺 据 全 球 80% 以 上 市 场 份额 。 

2) CDMA 2000 

CDMA 2000 是 由 窄带 CDMA(CDMA IS95) 技 术 发 展 而 来 的 宽带 CDMA 技术 ， 也 称 为 
CDMA Multi-Carrier， 它 是 由 美国 高 通 北 美 公司 为 主导 提出 ， 摩 托 罗拉 、Lucent 和 后 来 加 入 的 
韩国 三 星 都 有 参与 ， 韩 国 现在 成 为 该 标准 的 主导 者 。 这 套 系统 是 从 窄 频 CDMAOne 数字 标准 
衍生 出 来 的 ,可 以 从 原 有 的 CDMAOne 结构 直接 升级 到 3G, 建设 成 本 低廉 。 但 目前 使 用 CDMA 
的 地 区 只 有 日 本 、 韩 国 和 北美 ,所 以 CDMA2000 的 支持 者 不 如 W-CDMA 多 .不 过 CDMA 2000 
的 研发 技术 却 是 目前 各 标准 中 进度 最 快 的 ， 许 多 3G 手机 已 经 率先 面世 。 该 标准 提出 了 从 
CDMA IS95(2G) 一 CDMA 20001x 一 CDMA 20003x(3G) 的 演进 策略 。CDMA 20001x 被 称 为 2.5 
代 移 动 通信 技术 。CDMA 20003x 与 CDMA 20001x 的 主要 区 别 在 于 应 用 了 多 路 载波 技术 ， 通 
过 采用 三 载波 使 带宽 提高 。 目 前 中 国电 信 正 在 采用 这 一 方案 并 已 建成 了 CDMA 了 S95 网 络 。 
3) TD-SCDMA 
TD-SCDMA(Time Division-Synchronous CDMA, 时 分 同步 CDMA) 标 准 是 由 中 国内 地 独自 
制定 的 3G 标准 ，1999 年 6 月 29 日 ， 由 中 国 原 邮 电 部 电信 科学 技术 研究 院 (大 唐 电信 科技 股 
份 有 限 公 司 ) 向 ITU 提出 ， 但 技术 发 明 始 于 西门 子 公司 ，TD-SCDMA 具有 辐射 低 的 特点 ， 被 
誉 为 绿色 3G。 该 标准 将 智能 无 线 、 同 步 CDMA 和 软件 无 线 电 等 当今 国际 领先 技术 融 于 其 中 ， 
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第 9 章 上 


下 多 媒体 找 坟 及 其 应 用 (第 之 服 ) 
一 在 频谱 利用 率 、 对 业务 支持 具有 灵活 性 、 频 率 灵 活性 及 成 本 等 方面 具有 独特 优势 。 另 外 ， 由 






































于 中 国内 地 庞大 的 市 场 ， 该 标准 受到 各 大 主要 电信 设备 厂商 的 重视 ， 全 球 一 半 以 上 的 设备 厂 
商都 宣布 可 以 支持 TD-SCDMA 标准 。 该 标准 提出 不 经 过 2.5 代 的 中 间 环 节 , 直接 向 3G 过 渡 ， 
非常 适用 于 GSM 系统 向 3G 升级 。 军 用 通信 网 也 是 TD-SCDMA 的 核心 任务 。 相 对 于 另 两 个 
主要 3G 标准 CDMA 2000 和 WCDMA 它 的 起 步 较 晚 ， 技 术 不 够 成 熟 。 
4) WiMAX 
WiMAX (Worldwide Interoperability for Microwave Access 微波 存 取 全 球 互通 ) 又 称 为 
802.16 无 线 城 域 网 ， 是 一 种 为 企业 和 家 庭 用 户 提供 “最 后 一 英里 ”的 宽带 无 线 连接 方案 。 将 
此 技术 与 需要 授权 或 免 授 权 的 微波 设备 相 结合 之 后 ， 由 于 成 本 较 低 ， 将 扩大 宽带 无 线 市 场 ， 
改善 企业 与 服务 供应 商 的 认 知 度 。2007 年 10 月 19 日 ， 在 国际 电信 联盟 在 日 内 瓦 举行 的 无 线 
通信 全 体会 议 上 , 经 过 多 数 国家 投票 通过 , WiMAX 正式 被 批准 成 为 继 WCDMA、CDMA 2000 
和 TD-SCDMA 之 后 的 第 四 个 全 球 3G 标准 。 
内 3G 的 运营 始 于 2008 年 (2008 年 2 月 1 日 中 国 移 试 商用 运 营 )。2009 年 1 月 7 日 ， 
中 华人 民 共 和 国 工 业 和 信息 化 部 为 中 国 移动 、 中 国电 信和 联通 发 放 3 张 第 三 代 移动 通信 
(3G) 牌 照 ， 此 举 标志 着 我 国正 式 进入 3G 时 代 。 其 中 淮 币 国 移动 增加 基于 TD-SCDMA 技 
术 制 式 的 3G 牌照 (TD-SCDMA 为 我 国 拥 We 3G 技术 标准 )， 中 国电 信 增 加 基于 
CDMA 2000 技术 制式 的 3G 牌照 ， 中 国联 通 增 加 了 基于 WCDMA 技术 制式 的 3G 牌照 。 
从 此 ， 人 们 开始 步 入 手机 通信 的 3G 时 民利 用 手机 可 享受 可 视 电话 、 手 机 影视 、 手 机 音 
、 视 频 留 言 、 视 频 会 议 、 多 媒体 彩铃 、 数据 上 网 等 多 媒体 通信 服务 。 
目前 ，3G 通信 正 向 4G 过 渡 ; 4G 总 第 四 代 移动 通 人 及 其 技术 的 简称 ， 是 集 3G 与 WLAN 
一 体 ， 并 能 够 传输 高 质量 视频 图 像 及 图 像 传 输 质 量 与 高 清晰 度 电视 不 相 上 下 的 技术 产品 。 
4G 系统 能 够 以 100Mbfs 的 速度 下 载 ， 比 拨号 上 加 人 2 000 倍 ， 上 传 的 速度 也 能 达到 20Mb/s， 
并 能 够 满足 :几乎 所 有 用 户 对 于 无 线 服务 的 要 来。 外 ，4G 可 以 在 DSL 和 有 线 电 视 调 制 解 调 
器 没有 入 六 的 起 部 和 然后 再 扩展 到 整个 地 区 。 很 明显 ，4G 有 着 不 可 比拟 的 优越 性 。 


9.2.2 基于 计算 机 网 的 多 媒体 信息 传输 
1. FDDI 


光纤 分 布 式 数据 接口 (Fiber Distributed Data Interface, FDDD 是 ANSI 为 了 满足 用 户 对 网 络 
高 速 和 高 可 靠 性 传输 的 需求 ， 在 20 世纪 80 年 代 中 期 制定 的 网 络 标准 。 标 准 拟定 后 ，ANSI 
将 FDDI 呈 交 ISO， 由 ISO 开发 出 与 ANSI 标准 版 FDDI 完全 兼容 的 国际 版 FDDI。 

FDDI 的 速率 为 100Mb/s， 并 且 使 用 光纤 ( 单 模 或 多 模 ) 作 为 传输 介质 ， 光 纤 与 传统 铜 线 村 
比 具有 高 安全 性 、 高 可 靠 性 ， 以 及 高 传输 速率 等 优点 ， 因 此 ，FDDI 适用 于 各 项 指标 要 求 比较 
严格 的 高 数据 流量 网 络 的 主干 部 分 。 

FDDI 和 令 牌 环 网 络 一 样 使 用 令 牌 传递 作为 介质 访问 控制 方法 。 但 二 者 的 不 同 是 , 在 令 牌 
环 网 络 中 ， 令 牌 绕 行 整个 环 一 周 回 到 发 送 节点 后 才 被 释放 ， 绕 行 期 间 的 这 段 延迟 时 间 被 
浪费 掉 了 ， 因 为 在 令 牌 被 发 送 节点 释放 前 ， 其 他 任何 节点 都 不 能 发 送信 息 。 而 FDDI 采 
种 称 为 早期 令 牌 释放 (Early Token Release，ETR) 的 技术 ， 即 发 送 节点 在 帧 发 送 完毕 后 立刻 释 
放 令 牌 ， 这 个 令 牌 能 够 被 环 中 下 一 个 要 发 送信 息 的 节点 捕获 ， 此 时 环 上 将 有 不 止 一 个 令 牌 在 
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率 ， 从 而 达到 提高 速度 的 目的 。 
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时 传输 数据 。 这 种 早期 令 牌 释放 技术 使 得 每 个 节点 的 平均 等 待 时 间 减 少 ， 提 高 了 网 络 的 利 


为 了 实现 网 络 的 容错 机 制 ，FDDI 采用 双环 结构 ， 两 个 环 的 数据 流 方向 相反 。 在 正常 情况 
下 ， 两 个 环 路 中 只 有 主 环 (Primary Ring) 用 来 传输 数据 ， 而 辅 环 (Secondary Ring) 通 常 当 作 备 用 
环 路 。 如 果 主 环 发 生 故 障 ， 检 测 到 环 故障 的 站 点 (必须 是 双 连 接站 点 ) 就 会 将 数据 转移 到 辅 环 
-， 这 样 主 环 和 辅 环 共同 工作 重新 构成 了 一 个 环 。 只 连接 到 主 环 上 的 站 点 为 单 连 接站 点 (Single 





Attachment Station, SAS), 它 只 有 一 个 收发 器 , 同时 连接 到 两 个 环 上 的 站 点 为 双 连 接站 点 (Dual 


Attachment Station，DAS)， 它 有 两 个 收发 器 。 在 FDDI 网 络 中 ,只 有 DAS 才能 提供 容错 机 制 。 




















在 网 络 普遍 采用 10Mb/s 传输 速率 的 时 期 ，FDDI 技术 因 其 在 速率 方面 的 优势 ， 被 应 用 于 














LAN 的 主干 部 分 。 但 是 ， 随 着 以 太 网 技术 的 飞速 发 展 尤其 是 千 兆 以 太 网 技术 的 出 现 和 应 用 ， 


FDDI 的 技术 优势 已 不 复 存在 。 因 此 
汰 的 技术 。 
2. 以 太 网 





















































， 除 了 一 些 老 系统 还 在 应 用 外 ， 它 实际 上 是 一 种 逐步 被 淘 


KK 














以 太 网 (Etherneb 是 当今 局 域 网 采用 的 最 通用 的 通信 协议 标准 ， 组 建 于 20 世纪 70 年 代 时 





期 。 以 太 网 基本 上 由 共享 传输 媒体 ， 
机 构成 。 在 星 形 或 总 线 型 配置 结构 
作 站 彼此 之 间 相互 连接 。 
以 太 网 具有 的 一 般 特征 概述 如 1 
(1) 共享 媒体 。 所 有 网 络 设备 



































如 双 绞 线 电缆 或 同 轴 电缆 和 多 端口 集线器 、 网 桥 或 交换 
集线器/ 详 换 机 网 桥 通过 电 统 使 得 计算 机 、 打 印 机 和 工 


FE SS 
N <_ 
依次 使 用 同一 通信 媒体 ,1 


(2) 广播 域 。 需 要 传输 的 帧 被 发 送 到 所 有 节点 ， 但 只 有 寻找 到 的 节点 才 会 接收 到 帧 。 


(3) CSMA/CD。 在 以 太 网 中 利 





和 载波 监听 多 路 访问 /种 突 检测 方法 (Carrier Sense Multiple 


Access/Collision Detection) 以 防止 多 节点 同时 发 送 % 。 





(4) MAC 地 址 人 问 控制 层 的 所 肥大 网 络 接口 卡 (NIC) 都 采用 48 位 网 络 地 址 ， 


这 种 地 址 全 球 瞧 六 。> 
以 太 网 基本 网 络 组 成 如 下 。 





(1) 共享 媒体 和 电线。 常见 的 电线 有 10BASE-T( 双 绞 线 )、10BASE-2( 同 轴 细 绕 )、 


10BASE-5( 同 轴 粗 缆 )。 


(2) 转发 器 或 集线器 。 集 线 器 或 转发 器 是 用 来 接收 网 络 设 备 上 的 大 量 以 太 网 连接 的 一 类 设 
备 。 通 过 某 个 连接 的 接收 双方 获得 的 数据 被 重新 使 用 并 发 送 到 传输 双方 中 所 有 连接 设备 上 ， 


以 获得 传输 型 设备 。 
(3) 网 桥 。 网 桥 属 于 第 二 层 设备 








， 负 责 将 网 络 划分 为 独立 的 冲突 域 或 分 段 ， 达 到 能 在 同一 


个 域 或 分 段 中 维持 广播 及 共享 的 目标 。 网 桥 中 包括 一 份 涵盖 所 有 分 段 和 转发 帧 的 表格 ， 以 确 
保 分 段 内 及 其 周围 的 通信 行为 正常 进行 。 

(4) 交换 机 。 交 换 机 与 网 桥 相 同 ， 也 属于 第 二 层 设备 ， 且 是 一 种 多 端口 设备 。 交 换 机 所 支 
持 的 功能 类 似 于 网 桥 ， 但 它 比 网 桥 更 具 优 势 ， 它 可 以 临时 将 任意 两 个 端口 连接 在 一 起 。 交 换 
机 包括 一 个 交换 矩阵 ， 通 过 它 可 以 迅速 连接 端口 或 解除 端口 连接 。 与 集线器 不 同 ， 交 换 机 只 
转发 从 一 个 端口 到 其 他 连接 目标 节点 且 不 包含 广播 的 端口 的 帧 。 

以 太 网 协议 : IEEE 802.3 标准 中 提供 了 以 太 帧 结构 ， 当 前 以 太 网 支持 光纤 和 双 绞 线 媒体 








支持 下 的 4 种 传输 速率 : 
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其 中 
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根据 





多 媒体 技术 及 其 应 用 (第 2 版 ) 
(1) 10 Mb/s: 10BASE-T Ethernet(802.3)。 
(2) 100 Mb/s: Fast Ethernet(802.3u)。 
(3) 1000 Mb/s: Gigabit Ethernet(802.3z) 。 
(4) 10 Gb/s Gigabit Ethernet(802.3ae)。 


3. AT™M 


异步 传输 模式 (Asynchronous Transfer Mode，ATM) 技 术 是 在 电路 交换 方式 和 高 速 分 组 交 
式 基础 上 发 展 起 来 的 一 种 新 技术 ， 它 继承 了 电路 交换 方式 中 速率 的 独立 性 和 高 速 分 组 交 
式 对 任意 速率 的 适应 性 ， 并 针对 两 者 的 缺点 采取 有 效 对 策 ， 以 实现 高 速 传 送 综合 业务 信 
能 力 。 这 是 因为 ， 在 电路 交换 方式 中 ， 收 发 两 端 之 间 建 立 了 一 条 传输 速率 固定 的 信息 通 
在 通信 过 程 中 ， 不 论 是 否 收发 了 信息 ， 该 通路 均 被 某 呼叫 所 独占 ， 这 种 信息 传送 模式 被 
同步 传输 模式 (Synchronous Transfer Mode，STM)。 而 在 分 组 交换 方式 中 ， 不 对 呼叫 分 配 
电路 ， 仅 当 发 送信 息 时 才 送出 分 组 。 从 原理 上 讲 ， 这 各 模式 可 适应 任何 传输 速率 ， 但 
协议 的 控制 复杂 等 原因 很 难 满足 高 速 通信 的 要 求 。 < 

ATM 采取 的 主要 措施 如 下 。 , 

(1) 以 固定 长 度 的 信 元 (ce 内) 发送 信息 ， 能 话 应 侨 亲 这 站 - 具体 来 说 , 该 信 元 长 为 53 字 节 ， 
5 字 节 为 信 元 头 ， 其余 48 字 节 为 数据 。 这 个 信 的 长度 半 隐 了 效 闪 和 延 时 两 个 访 面 的 需 来 
(2) 在 协议 处 理 上 ， 用 硬件 对 头 部 信息 进行 识别 ， 采用 光纤 高 速 传输 ， 不 用 误 码 控制 和 流 
制 ， 大 大 降低 了 延 时 ， 使 信息 传送 速率 高 、 容 量 大 。 
(3) 尽量 采用 简单 协议 ， 灵活 性 强 、 用 户 可 以 应 用 从 到 极限 速率 的 任 一 有 效 码 速 ， 并 可 
自己 的 需要 灵活 地 配置 网 络 接口 所 用 的 带宽 ， 使 带宽 按 需 分 配 ”。 

AT™ 技术 得 以 实现 的 条 件 在 于 光纤 的 使 用 和 VEST 技术 的 发 展 。 由 于 光纤 传输 误 码 率 很 






































低 (109)、 信人 光合 只 和 和 法 行人 人 “而 流 控制 和 误 码 控制 大 部 分 都 可 留 给 终 
端 。VLSI 技术 则 使 协议 可 用 硬件 实现 ， 能 够 经 济 地 实现 高 速 交 换 。 

















从 本 质 上 讲 ,、 TM 是 一 种 高 速 分 组 传送 模式 。 它 将 各 种 媒体 的 数据 分 解 成 每 组 长 度 固定 


为 53 字 节 的 数据 块 ， 并 装配 上 地 址 、 优 先 级 等 信 头 信息 构成 信 元 ， 通 过 硬件 进行 交换 处 理 以 


达到 





高 速 化 。 它 和 以 前 分 组 交换 的 不 同 之 处 在 于 ， 几 乎 不 会 因 交换 处 理 而 造成 延迟 ， 所 以 不 








仅 可 
实时 
非常 


久 的 























于 通常 的 数据 通信 传送 正文 和 图 形 ， 还 可 以 用 于 传送 声音 、 动 画 和 活动 图 像 ， 能 满足 
通信 的 需要 。 换 句 话说 ， 它 是 兼 有 分 组 交换 和 电路 交换 双重 优点 的 通信 方式 。 因 此 ， 它 
适合 多 媒体 通信 模式 ， 具 有 很 好 的 应 用 前 景 。 

4. 宽带 了》 网 

网 络 信息 量 爆炸 式 增长 和 IP 技术 的 深入 人 心 促进 了 宽带 IP 主干 网 的 出 现 和 发 展 。 在 不 
将 来 ， 卫 协议 将 最 终 成 为 电信 网 中 的 主导 通信 协议 。 从 网 络 技术 的 发 展 趋势 来 看 ， 在 






































Internet 上 实现 多 媒体 通信 是 一 个 方向 ， 是 世界 各 国 的 主要 目标 。 为 实现 这 一 目标 ， 新 一 代 宽 带 


IP 网 
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SDH 
提供 
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络 要 建立 在 现 有 的 网 络 技术 基础 上 ， 建 立 在 当前 最 先进 的 网 络 传输 技术 基础 上 ， 分 为 两 
段 来 实施 。 第 一 阶段 称 为 IP over Everything， 典 型 的 相关 技术 有 IP over ATM、IP over 
、IP over WDM 等 。IP over ATM 融合 了 IP 和 ATM 技术 特点 ， 发 挥 ATM 支持 多 业务 、 

QoS 保证 的 技术 优势 。IP over SDH 直接 在 SDH 上 传送 IP 业务 ， 对 人 P 业务 提供 了 完善 
， 提 高 了 效率 。 而 耻 over WDM 采用 高 速 路 由 交换 机 设备 和 DWDM(Dense Wavelength 























， 对 不 





Division Multiplexing， 密 集 波 分 复 用 ) 技 术 ， 极 大 地 提高 了 网 络 带宽 


式 的 业务 提供 全 面 支持 。 这 一 阶段 




















Everything over IP， 如 ATM over IP、SDH over IP 及 DWDM over IP 等 ， 这 一 


的 将 来 得 以 实现 。 但是， 传统 的 Internet 使 用 IPv4 协议 ， 这 就 存在 着 带宽 


能 保证 、QoS 不 能 保证 及 IP 地 址 数 由 于 用 户 大 量 增加 显得 严重 不 足 等 缺点 。 


一 系列 措施 来 解决 这 些 问题 。 
1) IP over ATM 
IP over ATM 的 基本 原理 和 工作 方式 是 将 IP 数据 包 在 ATM 层 全 冲 
ATM 信 元 形式 在 信道 中 传输 。 当 网 络 中 的 交换 机 接收 到 一 个 IP 数据 包 时 ， 
据 包 的 IP 地 址 通过 某 种 机 制 进 行路 由 地 址 处 理 ， 按 路 由 转发 。 随 后 ， 














沟 目 标 已 经 基本 实现 ， 并 成 为 当今 的 主流 。 


按 已 计算 的 路 
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同 码 率 、 数 据 帧 格 

第 二 阶段 称 为 
目标 可 望 在 不 远 
不 易 控 制 、 延 时 不 
因此 ， 必 须 采 取 














封装 为 ATM 信 元 ， 以 


它 首先 根据 卫 数 
在 ATM 




















网 上 建立 虚 电 路 (Virtual Circuit，VC)。 以 后 的 卫 数据 包 将 在 此 虚 电 路 上 
方式 传输 再 经 过 路 由 器 ， 从 而 有 效 
度 提 高 到 交换 速度 。 
从 以 上 分 析 可 以 看 出 ，IP Over ATM 具有 以 下 优点 。 
(1) 由 于 ATM 技术 本 身 能 提供 QoS 保证 ， 因 此 ， 
(2) 具有 良好 的 流量 控制 均衡 能 力 及 故障 恢复 能 力 ， 
(3) 适应 于 多 业务 ， 具 有 良好 的 网 络 可 扩 
(4) 对 其 他 几 种 网 络 协议 ， 如 IPX 等 等 能 据 供 支持 
IP Over ATM 具有 如 下 缺点 XS) + 
(1) 目前 ，IP over ATM 还 不 能 提供 守 全 的 QoS 保证 。 
(2) 对 公路 由 的 支持 - NA 
(3) 在 复制 多 路 广播 方 


面 缺乏 高 效率 。 A 
(4) 由 于 ATM 本 身 技 复杂 ， 导 致 管 A 2 
2) IP over spH ~ 下 


IP over S 


Rt 


a IP 分 组 根据 RFC 1662 规范 简单 地 插入 到 PPP 帧 中 的 
SDH 通道 层 

















IN 


络 可 靠 性 高 。 





























-以 直通 (Cut- 
也 解决 了 IP ve RE IP 数据 包 


Through) 
9 转发 吉 











ek Jp 业务 的 Qos。 


1 
ppm ktm 30%. 


也 
Spi 网 络 作为 卫 数据 网 络 的 物理 传输 网 络 。 它 使 用 链 路 及 PPP 协议 对 人 P 


信息 段 。 然 后 再 由 
然后 向 下 经 过 SDH 





的 业务 适配器 把 封装 后 的 耳 数 据 包 映射 到 SDH 的 同步 净 荷 中 ， 
传输 层 和 段 层 , 加 上 相应 的 开销 ,把 净 荷 装 入 一 个 SDH 帧 中 , 最 后 到 达 光 
IP over SDH 也 称 Packet over SDH(PoS)， 它 保留 了 IP 面向 无 连接 的 特征 。 

从 以 上 分 析 可 以 看 出 ，IP over SDH 具有 以 下 优点 。 

(1) 对 人 PP 路 由 的 支持 能 力 强 ， 具有 很 高 的 IP 传输 效率 。 
(2) 符合 Internet 业务 的 特点 ， 如 有 利于 实施 多 路 广播 方式 。 
(3) 能 利用 SDH 技术 本 身 


同时 又 利用 OSPF 协议 防备 因 链 路 故障 造成 的 网 络 停顿 ， 提 高 网 络 的 
(4) 省 略 了 不 必要 的 ATM 层 ， 简 化 了 网 络 结构 ， 降 低 了 运行 费 
IP over SDH 具有 如 下 缺点 。 
(1) 仅 对 他 业务 提供 好 的 支持 ， 不 适 于 多 业务 平台 
(2) 不 能 像 IP over ATM 技术 那样 提供 较 好 的 QoS 保障 。 
(3) 对 IPX 等 其 他 主要 网 络 技术 支持 有 限 。 
3) IP over WDM 
IP over WDM 也 称 光 互 联网 。 













































































jj 。 


























其 基本 原理 和 了 








层 , 在 光纤 中 传输 。 


9 环 路 ,， 故 可 利用 自 愈合 (Selfhealing Ring) 能 力 达 到 链 路 纠 错 ， 


[ 作 方 式 是 在 发 送 端 ， 将 不 同 波长 的 光 信 号 
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根 光纤 中 传输 ， 在 接收 端 ， 又 将 组 合 光 信号 分 开 ( 解 复 用 ) 并 送 入 不 同 终端 。 





”组 合 ( 复 用 ) 送 入 





IP over WDM 是 一 个 真正 的 链 路 层 数据 网 ， 在 其 中 ， 高 性 能 路 由 器 通过 光 ADM 或 WDM 耦合 
器 直接 连 至 WDM 光纤 ， 由 它 控制 波长 接 入 、 交 换 、 选 路 和 保护 。IP over WDM 的 帧 结构 有 


两 种 形式 : SDH 








帧 格式 和 千 兆 以 太 网 帧 格式 。 





支持 IP over WDM 技术 的 协议 、 标 准 、 技 术 和 草案 主要 有 DWDM。 一般 峰值 波长 在 1 一 
10nm 量 级 的 WDM 系统 称 为 DWDM。 在 此 系统 中 ， 每 一 种 波长 的 光 信号 称 为 一 个 传输 通道 











(channel)。 每 个 通道 都 可 以 是 一 路 155Mb/s、622Mb/s、2.5Gb/s， 甚 至 10Gb/s 的 ATM 或 SDH 








或 是 千 光 以 太 网 


信号 等 。 DWDM 提供 了 接口 的 协议 和 速率 的 无 关 性 ， 在 一 条 光纤 上 ， 可 以 同 


时 支持 ATM、SDH 和 千 兆 以 太 网 ， 保 护 了 已 有 投资 ， 并 提供 了 极 大 的 灵活 性 。 


SDH 与 千 光 以太 网 帧 格式 比较 : 





目前 ， 主 要 网 络 再 生 设备 大 多 采用 SDH 帧 格式 ， 此 种 格式 下 报头 载 有 信 令 和 足够 的 网 络 


管理 信息 ， 便 于 
耗 时 ， 影 响 网 络 
目前 ， 在 局 
多 ， 但 由 于 没有 
协议 ， 对 抖动 和 
帧 进行 拆 装 分 割 
从 以 上 分 析 





千 兆 以 太 网 格式 








网 络 管理 。 相 比较 而 言 ， 在 路 由 器 接口 上 针对 tA 
吞吐 量 和 性 能 ， 而 且 采 用 SDH 帧 格式 的 转发 震 和 浮生 器 造价 昂贵 。 

域 网 中 主要 采用 千 光 以太 网 帧 结构 ， 此 头 包含 的 网 络 状态 信息 不 
使 用 那些 造价 昂贵 的 再 生 设备 ， 因 而 成 本 相对 较 低 。 由 于 使 用 的 是 “异步 " 
延 时 不 那么 敏感 。 同 时 由 于 与 主机 的 帧 结构 相同 ， 因 而 在 路 由 器 接口 上 需 对 
操作 ， ST 还 要 进行 比特 塞 入 操作 。 

可 以 看 出 ，IP over WDM. 其 有 以 下 优 















































(1) 充分 利用 光纤 的 带宽 资源 ， 极 天 地 提高 了 ; 带宽 和 相对 的 传输 速率 。 
(2) 传输 码 率 、 政 据 格式 及 调 人 方式 适 。 允 以 做 亿 基 的 ATM、SDH /SONET 和 


的 业务 。 了 


(3) 不 仅 可 以 与 现 有 通信 网 络 妆容 i 并 具有 可 


推广 性 、 高 度 生 


存 性 等 特点 。 


不 ~ 
IP over WR 具有 如 下 缺点 。 和 


(1) 目前 ， 


于 波长 标准 化 还 没有 实现 。 > 般 取 193.1THz 为 参考 频率 ， 间 隔 为 100GHz。 


(2) WDM 系统 的 网 络 管理 应 与 其 传输 的 信号 的 网 络 管理 分 离 , 但 在 光 域 上 加 上 开销 和 光 


信号 的 处 理 技术 





还 不 完善 ， 从 而 导致 WDM 系统 的 网 络 管理 还 不 成 熟 。 


(3) 目前 ，WDM 系统 的 网 络 拓扑 结构 只 是 基于 点 对 点 的 方式 ， 还 没有 形成 “ 光 网 ”。 





宽带 的 IP 业务 方面 ，IP over SDH 技术 由 于 去 掉 了 ATM 设备 ， 投 资 少 、 见 效 











快 而 且 线路 利 
而 IP over ATM 











适合 于 提供 高 
Data 多 项 业务 ， 
现 有 的 网 络 带宽 
下 ， 这 种 技术 能 
方向 。 
4) MPLS 
多 协议 标签 交 
标签 引导 数据 
接 模式 的 特性 ， 
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率 高 。 因 而 就 目前 而 言 ， 发 展 高 性 能 IP 业务 ，IP over SDH 是 较 好 的 选择 。 
技术 则 充分 利用 已 经 存在 的 ATM 网 络 和 技术 ， 发 挥 ATM 网 络 的 技术 优势 ， 











能 的 综合 通信 服务 ， 因 为 它 能 够 避免 不 必要 的 重复 投资 ， 提 供 Voice、Video、 








是 传统 电信 服务 商 的 较 好 选择 。 对 于 IP over WDM 技术 ， 它 能 够 极 大 地 拓展 
， 最 大 限度 地 提高 线路 利用 率 ， 并 且 在 外 围 网 络 千 兆 以 太 网 成 为 主流 的 情况 
真正 地 实现 无 颖 接 入 。 应 该 说 ，IP over WDM 将 是 宽带 人 P 主干 网 的 主流 发 展 









































< 换 技术 (Multi Protocol Label Switching，MPLS) 是 一 种 在 开放 的 通信 网 上 利 
高 速 、 高 效 传输 的 新 技术 。 它 的 价值 在 于 能 够 在 一 个 无 连接 的 网 络 中 引入 连 
主要 优点 是 减少 了 网 络 复杂 性 ， 兼 容 现 有 各 种 主流 网 络 技术 ， 能 降低 50% 网 














| 第 9 章 有 
多 天 休 对 


络 成 本 , 在 提供 IP 业务 时 能 确保 QoS 和 安全 性 ,具有 流量 工程 (Traffic Engineering) 能 力 。MPLS 
技术 是 下 一 代 最 具 竞 争 力 的 多 媒体 通信 网 络 技术 。 

未 来 的 业务 以 突 发 性 数据 业务 为 主 , ATM 对 此 显得 效率 不 足 , 传输 成 本 和 交换 成 本 较 高 ， 
网 络 资源 浪费 ， 而 卫 又 显得 能 力 不 够 。 

1997 年 ,以 Cisco 公司 为 主 的 几 家 公司 , 包括 Ipsilon( 已 被 Nokia 并 购 )、 IBM、Cascade( 已 
被 Lucent 并 购 )、Toshiba 提出 了 MPLS 技术 。 

MPLS 引入 了 转发 等 价 类 (Forwarding Equivalence Classes，FEC) 的 概念 ， 所 有 需要 做 相同 
转发 处 理 ， 并 转发 到 相同 下 一 跳 的 分 组 属于 同一 转发 类 。 在 传统 的 卫 数据 包 转 发 过 程 中 ， 按 
照 “ 最 长 匹配 ”的 原则 查找 路 由 表 ， 以 确定 下 一 跳 的 地 址 ， 这 一 原则 可 能 导致 多 次 查找 匹配 ， 
因而 在 一 定 程度 上 影响 路 由 器 的 性 能 。 在 MPLS 中 ， 每 个 数据 包 都 带 有 标签 ， 并 根据 标签 被 




























































































转发 ， 不 需要 将 数据 包 分 析 到 网 络 层 ， 而 且 ， 由 于 数据 包 使 用 的 标签 具有 转发 的 唯一 性 ， 降 
多 了 转发 表 的 查找 次 数 ， 从 而 提高 了 数据 包 的 转发 速度 。 | 伦 

MPLS 技术 的 主要 特点 如 下 。 二 二 

(1) 充分 采用 原 有 的 卫 路 由 ， 在 此 基础 上 加 以 改进 ， Pers 网 络 路 由 具有 灵活 性 
I 特点 。 < 

(2) 采用 ATM 的 高 效 传输 交换 方式 ， 地 弃 复 尖 败 AT 信和 无 颖 地 将 卫 技术 的 优点 融 
合 到 ATM 的 高 效 硬件 转发 中 。 _ "> 











G) MPLS 网 络 的 数据 传输 和 路 由 计算 分 开 ; 是 一 种 面向 连接 的 传输 技术 ， 能 够 提供 有 效 
条 QoS 保证 。 NAN 
(4) MPLS ea -种 与 链 路 无 关 的 技术 , 它 同 时 支持 X.25、 
贞 中 继 、ATM、PPP、SDH、DWDM 等 ， 保 证 了 多 种 网络 的 互 连 互通 ， 使 得 各 种 不 同 的 网 络 
传输 技术 统一 在 同一 个 MPLS 平 台 上 。 NN X 
(5) MPLS 支持 天 规模 层次 化 的 网 络 拓扑 结构 ， 具有 良好 的 网 络 扩 展 性 。 
(6) MPLS 的 标签 全 机 制 支持 不 同 数 乌 流 的 合 传输 。 
(7) MPLS 支持 流量 工程 、CoS、QoS 和 大 规模 的 虚拟 专用 网 。 


9.2.3 ”基于 有 线 电视 网 的 多 媒体 信息 传输 
1l. VOD 


除了 以 上 介绍 的 “电信 网 + 多 媒体 ”和 “计算 机 网 + 多 媒体 ”这 两 条 多 媒体 信息 传输 的 发 
展 线路 以 外 ， 国 际 上 正在 大 力 发 展 第 3 条 路 线 ， 即 “有 线 电视 (CATV) 网 + 多 媒体 ”， 也 就 是 视 
频 点 播 或 点 播 电 视 ， 有 时 也 被 称 为 交互 式 电视 (Interactive TV，ITV)。 
点 播 电 视 是 从 1993 年 发 展 起 来 的 。 当 时 ， 美 国 第 二 大 有 线 电视 公司 一 一 Time Warner 美 
国 西部 公司 联盟 ，1994 年 开始 利用 休 斯 公司 的 卫星 播 出 150 套 节目 ， 经 营 可 视 电 话 业 务 ， 并 
在 佛罗里达 州 试验 推出 了 以 一 系列 交互 服务 为 内 容 的 “全 面 服务 网 络 ”。 
电视 机 的 交互 功能 一 一 外 置 设备 与 电视 机 一 体 化 发 展 起 来 后 ， 用 户 就 可 通过 电视 上 网 ， 
被 动 看 电视 变 为 主动 选择 电视 节目 ， 同 时 可 以 浏览 Intemet 上 的 信息 。Web TV 的 出 现 为 电 
视 的 发 展 带 来 了 新 的 契机 ， 用 户 只 要 在 现 有 的 电视 上 加 一 个 机 顶 盒 ， 电 视 机 就 可 以 实现 交互 
功能 与 Internet 相连 , 用 户 只 须 投 入 很 少 资金 就 可 上 网 ， 由 于 操作 简单 也 解决 了 用 户 上 网 的 基 
础 问题 ， 加 上 电视 机 的 普及 ， 更 加 快 了 信息 资源 的 推广 利用 。 
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下 多 媒体 找 坟 及 其 应 用 (第 之 服 ) 
i 视频 点 播 系统 采用 客户 机 /服务 器 模式 ， 将 图 文 、 视 音频 素材 存 于 视频 服务 器 中 ， 客 户 端 





























可 随时 通过 有 线 电 视 网 和 内 部 电话 网 交互 式 地 查询 点 播 服务 器 中 的 媒体 信息 。 该 系统 既 可 以 
广泛 地 应 用 于 宾馆 、 酒 店 和 娱乐 场所 ， 也 可 以 应 用 于 住宅 小 区 、 教 育 系统 、 图 书馆 、 政 府 机 
关 和 企 事业 单位 。 

2. HFC 与 Cable Modem 






































1) HFC 

考虑 到 FTTH( 光 纤 到 户 ) 和 FTTC( 光 纤 到 路 边 ) 成 本 很 高 (包括 光端机 、 光 纤 、 高 速 信息 处 
理 器 等 ), 一 时 还 难以 实现 ，AT&T 公司 于 1994 年 初 提出 混合 光纤 / 同 轴 电 缆 (HFC)， 首 先 瞄准 
的 就 是 CATYV 市 场 。HFC 与 传统 的 CATV 网 相 比 ， 其 优点 是 可 以 在 同一 媒介 中 同时 传输 多 种 
业务 ， 包 括 POTS、 广 播 模拟 电视 、 广 播 数字 电视 、VOD、 高 速 数字 数据 等 。HFC 电缆 链 路 的 
理论 容量 极 大 ， 可 用 带宽 达 1GHz。HFC 把 总 带宽 分 成 两 部 分 ， 下 行 { 往 住宅 ) 频 带 为 SO0MHz 一 
1GHz (50 一 550MHz 一 一 模拟 有 线 电视 ，550 一 750MHz 一 一 电话 和 据 下 行 、MPEG-2 数字 电 
视 . VOD 点 播 下 行 , 750MHz~1GHz 一 一 个 人 通信 及 新 业务 j: 称 为 正 向 通道 , 上 行 频带 为 5 一 
40MHz， 称 为 反 向 通道 。 使 用 这 样 的 带宽 ，HFC 能 够 传送 以 百 计 的 广播 、VOD 信和 号、 电话 
及 频带 很 宽 的 双向 数字 链 路 (如 接 入 mtemeb。 、* NA 

人 hie nn 
典型 的 HFC 系统 能 为 连 到 同一 子 系统 的 多 个 用 提供 共享 的 10~~25Mb/s 的 带宽 。 虽 然 从 物 
理 上 看 ，HFC 和 FTTC 很 相似 ,但 后 者 传送 的 是 数字 信号 ,而 前 者 是 模拟 信号 。 从 投资 上 说 ， 
目前 以 提供 分 配 型 视 像 业务 为 主 ， 在 交互 式 和 数字 型 业务 普及 率 不 高 的 情况 下 ，HFC 方式 比 
FTTC 更 为 经 济 。 SN» ,XK 

2) Cable Modem 、 2 x 

电线 调制 解 调 器 (Cabie Modem，CM)， 又 线 缆 调制 解 调 器 它 是 近 几 年 随 着 网 络 应 用 的 
扩大 而 发 展 起 来 的 ， -主要 用 于 有 线 电视 网 进行 数 传输 。Cable Modem 技术 以 比 标准 的 V90 
电话 Modem 技术 快 .100 僧 以 上 的 速度 接 入 Iniemet。 
Cable Modenm 与 以 往 的 Modem( 调 制 解 调 器 )， 在 原理 上 都 是 将 数据 进行 调制 后 ， 在 电缆 
的 一 个 频率 范围 内 传输 ， 接 收 时 进行 解 调 ， 传 输 机 制 与 普通 Modem 相同 ， 不 同 之 处 在 于 它 是 
通过 CATYV 的 某 个 传输 频带 进行 调制 解 调 的 ,而 普通 Modem 的 传输 介质 在 用 户 与 交换 机 之 间 
是 独立 的 ， 即 用 户 独 享 通信 介质 。Cable Modem 属于 共享 介质 系统 ， 其 他 空闲 频段 仍然 可 用 
于 有 线 电视 信号 的 传输 。Cable Modem 彻底 解决 了 由 于 声音 图 像 的 传输 而 引起 的 阻塞 ， 其 速 
率 已 达 10Mb/s 以 上 ， 下 行 速率 则 更 高 。 
Cable Modem 也 是 组 建城 域 网 的 关键 设备 , 混合 光纤 同 轴 网 (HFC) 主 干线 用 光纤 ， 光 节 点 
小 区 内 用 树 形 总 线 同 轴 电 缆 网 连接 用 户 ， 在 HFC 网 中 传输 数据 就 需要 使 用 Cable Modem。 





































































































9.3 ”多 媒体 通信 系统 




















高 速 网 络 技术 的 发 展 ， 大 大 改善 了 网 络 的 多 媒体 应 用 环境 ， 推 动 了 网 络 多 媒体 应 用 的 发 
展 ， 出 现 了 很 多 多 媒体 通信 系统 ， 如 可 视 电话 、 多 媒体 会 议 系 统 、 多 媒体 邮件 系统 、 多 媒体 
信息 咨询 系统 、 交 互 式 信息 点 播 系统 、 远 程 教育 系统 、 远 程 医疗 系统 、 卫 电话 等 。 同 时 ， 多 
媒体 通信 系统 的 应 用 也 对 计算 机 网 络 技术 、 数 据 存储 技术 和 分 布 式 处 理 技术 等 提出 了 更 高 的 
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第 9 章 


让 记念 | 
要 求 ， 带 动 了 相关 技术 的 进步 。 下 面 将 介绍 几 种 典型 的 多 媒体 通信 系统 ， 如 可 视 电 话 、 电 视 
会 议 系 统 、 视 频 点 播 系 统 、IP 电话 等 ， 从 中 可 以 看 出 这 些 系统 的 不 同 技术 特色 和 风格 。 
9.3.1 多 媒体 通信 系统 概述 


多 年 来 , 国际 电信 联盟 为 公共 和 私营 电信 组 织 制定 了 许多 多 媒体 计算 和 通信 系统 的 推荐 标 
准 ， 以 促进 各 国之 间 的 电信 合作 。 国 际 电信 联盟 的 26 个 系列 (A~Z) 推 荐 标准 中 ， 与 多 媒体 通 





















































信 关 系 最 密切 的 7 个 系列 标准 见 表 9-1，3 种 类 型 的 多 媒体 通信 系统 的 核心 技术 标准 见 表 9-2。 
表 9-1 ITU 系列 推荐 标准 












主要 内 容 
传输 系统 、 媒 体 数字 系统 和 网 络 
视听 和 多 媒体 系统 


系列 名 


Series G 














Series H 









SeriesT 












电视 、 声 音节 目 和 其 他 多 媒体 信号 的 传输 
电话 交换 和 控制 信号 传输 法 
; 息 处 表 业 务 的 终端 设备 
电话 网 汪 的 数据 通信 





SeriesJ 





Series 工 
Series V 





表 9.2 .3 个 主要 的 系列 标准 _ 





系列 标准 名 H:320 习 H.323(V3/V2) H.324 

发 布 时 间 1990 +r "7 1996/1698 | 1996 

应 用 范围 窄带 ISDN 带宽 无 保证 分 组 交换 网 络 PSTN 

图 像 编 码 再 261，H.263 -了 H.361, H.263 H.261，H.263 

声音 编码 “AAAN|》 G711，G722，G728 [S71 G722, G728 G723.1 
G723.1，G729 

多 路 复合 控制 H.221，H.230/H.242 H.225.0，H.245 H.223，H.245 

多 点 H.231，H.243 H.323 

数据 T.120 T.120 T.120 











20 世纪 90 年 代 初 开发 的 电视 会 议 标准 是 H.320， 它 定义 通信 的 建立 、 数 字 电视 图 像 和 声 
音 压 缩编 码 的 算法 ， 运 行 在 综合 业务 数字 网 上 。 在 56Kb/s 传输 率 的 通信 信道 上 支持 帧 速率 比 
较 低 的 电视 图 像 ， 而 在 1.544 Mb/s 传输 率 的 信道 (T1 信道 ) 上 可 以 传输 CIF 格式 的 满 帧 速率 电 
视图 像 。 在 局 域 网 上 的 桌面 电视 会 议 (Desktop Video Conferencing) 采 用 H.323 标准 ， 这 是 基于 
分 组 交换 的 多 媒体 通信 系统 。 在 公众 交换 电话 网 Public Switched Telephone Network，PSTN) 
上 的 网 络 桌面 电视 会 议 使 用 调制 解 调 器 ， 采 用 H.324 标准 。Internet 上 的 电视 会 议 目前 大 部 分 
都 趋向 于 采用 H.323 标准 和 正在 开发 的 SIP 标准 ( 详 见 9.3.5 节 ), 使 用 人 P 协议 提供 局 域 网 上 的 
电视 会 议 ， 而 全 球 的 Internet 电视 会 议 目前 还 不 能 保证 实时 电视 会 议 的 服务 质量 。 
在 多 媒体 通信 标准 中 ， 电 视图 像 的 编码 标准 都 采用 H.261 和 H.263。H.261 主要 用 来 支持 
电视 会 议和 可 视 电 话 ， 并 于 1992 年 开始 应 用 于 ISDN。 该 标准 采用 帧 内 压缩 和 帧 间 压 缩 技 术 ， 
可 使 用 硬件 或 者 软件 来 执行 。 电 视图 像 数 据 压 缩 后 的 数据 速率 为 PX 64Kb/s， 其 中 P 的 变动 
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职 
we wy 


一 范围 为 
在 H.261 的 基础 上 开发 的 电视 图 像 编码 标准 ， 用 于 低位 速率 通信 的 电视 图 像 编码 ， 目 标 是 改 


善 在 调 

计 
信和 系统 
媒体 通 
端 包 括 
定义 了 
一 个 重 
的 功能 


全 多 天 条 技术 坟 鞭 应用 (第 到 县 ) 
1~30， 取 决 于 所 使 用 的 ISDN 通道 数 。H.261 支持 CIF 和 QCIF 的 分 辨 率 。H.263 是 





























制 解 调 器 上 传输 的 图 像 质 量 ， 并 增加 了 对 电视 图 像 格式 的 支持 。 
算 机 网 络 是 多 媒体 通信 的 基础 ， 电 路 交换 网 络 与 分 组 交换 网 络 的 融合 是 构造 多 媒体 通 
结构 的 出 发 点 。 图 9.1 给 出 了 多 媒体 通信 系统 的 结构 示意 图 。 从 图 9.1 中 可 用 看 到 ， 多 
信 系 统 主要 由 网 关 (Gateway)、 会 务 器 (Gatekeepers) 和 通信 终端 (Terminal) 组 成 。 通 信 终 
执行 H.320、H.323 或 者 H.324 协议 的 计算 机 和 执行 H.324 的 电话 机 。 此 外 ，H.323 还 
一 个 称 为 多 点 控制 单元 (Multipoint Control Unit，MCU) 的 部 件 ， 它 是 H.320 和 H.323 的 
要 设备 ， 可 作为 一 个 单独 的 设备 接 入 到 网 络 上 ， 但 现在 开发 的 一 些 产品 则 把 它 要 实现 
集成 到 会 务 器 中 ， 因 此 图 中 未 画 出 。 在 H.323 协议 中 ， 把 通信 终端 、 网 关 、 会 务 器 或 










































































者 MCU 称 为 端点 (Endpoint)。 
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人 韦 了 ?起 术 ) 
9.1 多 媒体 通信 系统 的 整体 结构 示意 图 


关 和 会 务 器 是 多 媒体 通信 系统 的 两 个 极其 重要 的 组 成 部 件 。 网关 提 供 面 向 媒体 的 功能 ， 
音 和 电视 图 像 数据 和 接收 数据 包 等 。 会 务 器 提供 面向 服务 的 功能 ， 如 身份 验证 、 呼 
选择 和 地 址 转换 等 。 网 关 和 会 务 器 密切 配合 完成 多 媒体 通信 的 任务 。 下 面 介绍 其 主 
功能 与 结构 。 

网 关 
关 是 一 台 功 能 强大 的 计算 机 或 者 工作 站 , 它 担负 电路 交换 网 络 (如 电话 网 络 ) 和 分 组 交换 

Internet) 之 间 进 行 实时 的 双向 通信 ， 提 供 异种 网 络 之 间 的 连通 性 ， 它 是 传统 电路 交换 
现代 IP 网 络 之 间 的 桥梁 。 
关 的 基本 功能 可 归纳 为 3 种 。 





























(1) 转换 协议 (Translating Protocols)。 网 关 作为 一 个 解释 器 ， 使 不 同 的 网 络 能 够 建立 联系 ， 


如 允许 


PSTN 和 H.323 网 络 相互 对 话 以 建立 和 清除 呼叫 。 


(2) 转换 信息 格式 (Converting Information Formats)。 不 同 的 网 络 使 用 不 同 的 编码 方法 ， 网 


5 





a 
多 天 休 对 一 区 


关 将 对 信息 进行 转换 ， 使 异种 网 络 之 间 能 够 自由 地 交换 信息 ， 如 声音 和 电视 。 
(3) 传输 信息 (Transferring Information)。 网 关 负 责 在 不 同 网 络 之 间 传 输 信 息 。 














网 关 有 如 下 主要 部 件 。 


(1) 电路 交换 网 络 (Switched-Circuit Network，SCN) 接 口 卡 是 一 种 典型 的 TIE1 或 者 称 为 
PRI ISDN 线路 接口 卡 , 它们 与 电路 交换 网 络 进行 通信 。 主 速率 接口 (primary rate interface, PRD 





由 23 个 B 通道 和 一 个 64Kb/s 的 D 通道 组 成 ， 称 为 23B 十 D， 相 当 于 T1 线 的 带宽 。 


(2) 数字 信号 处 理 器 (Digital Signal Processors，DSP) 卡 执行 的 任务 包括 声音 信号 的 压缩 和 





可 音 的 取消 等 。 























10/100BASE-T 网 络 接口 卡 ， 或 者 把 它们 的 功能 集成 到 主机 板 上 。 





的 主机 板 上 。 
网 关 有 如 下 主要 软件 。 








(3) 网 络 接口 (Network Interfaces) 卡 用 来 与 H.323 网 络 进行 通信 ， 典 型 的 网 络 卡 包括 


(4) 控制 处 理 器 (Control Processor) 协 调 其 他 网 关 部 件 的 所 有 活动 , 这 个 部 件 通常 是 在 系统 


(1) 执行 所 有 网 关 基 本 功能 和 选择 功能 的 网 关 软 件 。 科 如， H.323 网 关 平台 (Gateway 


Platform) 执 行 转换 协议 、 转换 消息 格式 和 传输 信息 等 基本 功能 ， 支持 声音 压缩 、 协 议 转 换 、 


实时 的 传真 解 调 /再 调制 及 执行 H.323 系列 协议 。 
(2) 特定 网 关 的 应 用 软件 ， 它 执行 自 定义 的 功能 及 管理 和 控制 
图 9.2 表示 一 种 网 关 的 基本 结构 及 网 关 如 何 使 公共 电话 交换 
Internet 电话 之 间 进 行 会 话 。 图 9.2 中 的 时 分 多 路 复 用 (TDM) 总 


























网 络 


线 可 


功能 。 


系统 上 的 电话 与 现代 的 
以 是 MVIP 总 线 或 者 


SCSA(Signal Computing System Architécture, 信 号 计算 机 票 统 结 构 ) 总 线 。 多 厂商 集成 协议 


(Multi Vendor Integration Protoeol MVIP) 是 由 许多 公司 共同 制定 前 
交换 协议 ， 是 PC 中 的 通信 和 总线， 
256 个 全 双 工 (full-duplex) 邮 i 通道 。 SCSA 是 二 种 传输 声 音 和 电 















于 设计 和 建造 计算 机 电话 服务 机 系统 ， 它 的 总 线 称 为 SCSA 总 线 。 


用 于 从 一 块 声音 卡 到 另 一 块 声音 


一 和 





视图 





司 (Parsippany， “Nj,>www.dialogic.com) 发 起 并 和 其 他 70 多 个 公司 


"用 于 PC 的 声音 总 线 和 
的 转 接 过 程 中 复合 多 达 
像 信号 的 开放 结构 , 用 








这 种 结构 是 由 Dialogic 公 
-起 开发 的 。SCSA 主要 集 


中 在 信号 计算 、 媒 体 (包括 声音 、 图 像 和 传真 等 的 ) 管 理 、 呼 叫 信号 处 理 及 系统 结构 ， 提 供 了 非 


常 灵 活 的 机 制 。 


网 络 “ 
-nemovdl ky) 
= 


PC 一 一 











网 英 《 


计算 机 总 线 ( 如 ISA) TDM 总 线 (MVIPSCSA) 
店 入 的 声音 /传真 ) (未 压 塘 的 PCM 才 音 /传真 ] 





图 9.2 网 关 的 基本 结构 
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下 多 媒体 找 坟 及 其 应 用 第 之 服 ) 


一 2. 会 务 器 




















会 务 器 是 用 于 连接 IP 网 络 上 的 H.323 电视 会 议 客 户 ， 是 电视 会 议 的 关键 部 件 之 一 ， 许 多 
人 把 它 当 作 电 视 会 议 的 “大 脑 ”。 它 提供 授权 和 验证 、 保 存 和 维护 呼叫 记录 、 执 行 地 址 转换 ， 
而 不 需要 记忆 IP 地 址 、 监 视 网 络 、 管 理 带宽 以 限制 同时 呼叫 的 数目 ， 从 而 保证 电视 会 议 的 质 
量 ， 提 供与 现存 系统 的 接口 。 会 务 器 的 功能 一 般 都 用 软件 来 实现 。 会 务 器 的 功能 分 成 两 个 部 
分 ， 即 基本 功能 和 选择 功能 。 

会 务 器 必须 要 提供 的 基本 功能 如 下 。 

(1) 地 址 转换 (Address Translation): 使 用 一 种 可 由 注册 消息 (Registration messages) 更 新 的 
转换 表 ， 把 别名 地 址 转换 成 传输 地 址 (Transport Address)。 这 个 功能 在 电路 交换 网 络 上 的 电话 
企图 呼叫 卫 网 络 上 的 PC 时 显得 尤其 重要 ， 在 确定 网 关 地 址 时 也 很 重要 。 

(2) 准 入 控制 (Admissions Control): 使 用 准 入 请 求 (Admission Request，ARQ)/ 准 入 确认 
(Admission Confirm，ARJ)/ 准 入 拒绝 [Admission Reject， ARC) 消 息 对 访问 局 域 网 进行 授权 。 
H.323 标准 规定 必须 要 有 用 来 对 网 络 服务 进行 授权 的 RAS 消息 (RAS Messages)，RAS 是 一 个 
注册 / 准 入 /状态 (Registration/Admission/Status) 协 议 ， a 义 授权 存 取 网 络 资源 的 规则 或 者 

JYAo 





















































政策 ， 因此 服务 提供 者 需要 会 务 器 来 干预 现存 的 授权 方 此 外 ， 企 业 管理 人 员 和 服务 提供 
者 也 许 想 使 用 自己 的 标准 来 授权 。 例 如 ， 根据 订金 S\ 信 用 卡 等 

(3) 带宽 控制 (Bandwidth Control): 支持 RAS; 带 宽 消息 (RAS bandwidth messages)， 即 带宽 
请 求 (BandWidth Request， BRQ)/ 带 宽 确认 (BandWidth Confirm，BCF)/ 带 宽 拒绝 (BandWidth 
Reject，BRJ) 消 息 ， 以 强制 执行 带宽 控制 》 守 于 如 何 管理 则 根据 服务 提供 者 或 者 企业 管理 人 
员 的 政策 来 确定 。 在 许多 情况 下 ) 如 果 在 网 络 或 者 特定 的 网 不 拥挤 的 情况 下 ， 对 任何 带宽 
的 请 求 都 应 该 给 予 满足 。 -二 WL” 

(4) 区 域 管理 (Zone Minagement): 用 于 管理 所 有 已 经 注册 的 H.323 端点 (Endpoint)， 为 它 
们 提供 以 上 介绍 的 项 能 。 至 于 确定 哪个 终端 再 以 注册 及 地 理 或 者 逻辑 区 域 的 组 成 (单个 会 务 器 
管理 的 终端 、 网 关 和 U) 则 由 网 络 设计 人 员 诡 定 。 

会 务 器 提供 的 选择 功能 如 下 。 

(1) 呼叫 控制 信号 传输 方法 (Call Control Signaling): 在 H.323 中 有 两 种 呼叫 控制 信号 传输 
模型 ， 会 务 器 安排 呼叫 信号 传输 模型 (Gatekeeper Routed Call Signaling ModeD) 和 直接 端点 呼叫 
信号 传输 模型 (Direct Endpoint Call Signaling Model)。 会 务 器 可 根据 访问 提供 者 的 要 求 进行 选择 。 

(2) 呼叫 授权 (Call Authorization): 会 务 器 可 根据 服务 提供 者 指定 的 条 件 对 一 个 给 定 的 呼 
叫 进行 授权 或 者 拒绝 。 其 条 件 可 包括 会 议 时 间 、 预 定 的 服务 类 型 、 对 受 限 网 关 的 访问 权限 或 
者 可 用 的 带宽 等 。 

(3) 带宽 管理 (Bandwidth Management): 根据 服务 提供 者 指定 的 带宽 分 配 确定 是 否 有 足够 
的 带宽 用 于 呼叫 。 

(4) 呼叫 管理 (Call Management): 提供 智能 呼叫 管理 。 会 务 器 维护 一 种 H.323 呼叫 表 以 指 
示 被 呼叫 终端 是 否 处 于 忙 状态 ， 并 为 带宽 管理 (Bandwidth Management) 功 能 提供 信息 。 

会 务 器 通常 设计 成 内 外 两 层 , 内 层 称 为 核心 层 , 它 由 执行 H.323 协议 堆 的 软件 和 实现 MCU 
功能 的 软件 组 成 ， 有 的 软件 开发 公司 把 它 称 为 H.323 会 务 器 核心 功能 部 件 。MCU 的 主要 功能 
是 连接 多 条 线路 并 自动 或 者 在 会 议 主持 人 的 指导 下 手动 交换 电视 信号 。 

会 务 器 的 外 层 由 许多 应 用 程序 的 接口 组 成 ， 用 于 连接 网 络 上 现 有 的 许多 服务 。 外 层 软件 
可 由 下 面 的 软件 模块 组 成 。 
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Ne 
多 天 条 对 


(1) 用 户 的 授权 和 验证 (User Authentication & Authorization): 处 理 所 有 用 户 的 授权 ， 并 使 
现 有 的 远程 验证 电话 接 入 用 户 服务 (Remote Authentication Dial-In User Service, RADIUS) 协 
议 进行 验证 。 

(2) 事务 管理 接口 (Administration Interface): 为 管理 人 员 提 供 会 务 器 的 管理 界面 ， 对 享有 
设置 /修改 /删除 配置 的 特权 的 用 户 提供 服务 权限 、 会 务 器 的 远程 管理 ， 以 及 显示 网 络 状 态 、 统 
计 、 报 警 等 。 
(3) 网 络 管理 (Network Management): 为 简单 网 络 管理 协议 (Simple Network Management 
Protocol，SNMP) 代 理 程序 提供 注册 终端 数目 、 正 在 工作 的 终端 数目 、 呼 叫 数目 、 分 配 带宽 、 
正在 使 用 的 带宽 和 保留 的 可 用 带宽 、 网 关 资 源 分 配 和 可 用 的 网 关 资 源 、MCU 资源 的 分 配 和 可 
用 的 MCU 资源 、 内 部 资源 信息 和 运行 状态 。 

(4) 安全 管理 (Security Management)。 _ 

(5) 辅助 功能 (Supplementary Features): QoS 等 级 的 选择 、 呼 叫 者 线路 识别 描述 (Caller 
Line _ Identification Presentation ，CLIP) 、 呼 叫 者 线路 识 别人 限 定 《 aller line Identification 
Restriction，CLIR )、 呼 叫 等 待 (Call Waiting)、 呼 叫 保持 (Cill Hold)、 呼叫 分 机 代 接 (Call 
Park/Pickup)、 呼叫 转移 (Call Transfer)、 呼叫 遇 忙 /无 答应 ; 转移 (Call Forward on Busy/No answer)、 
缩 位 拨号 (Abbreviated dialling)、 优 先 线路 (Priority i089) 的 服务 管理 及 对 接收 的 传真 的 存储 和 
转发 (Incoming FAX store and forward)。 ~ 

(6) 媒体 资源 服务 (Media Resource 六 报警 服务 (Alam Service)、 声 音 邮 件 服务 
(Voice Mail Services) 和 使 用 交互 声 NS 总 答 丽 互相 配合 的 服 Wo with Interactive 
Voice Response Services)。 X%b AN、 

(7) 目录 服务 (directory A f 网 络 上 执行 简便 目 荣 的 存 取 协 议 (Lightweight Directory 
Access Protocol， LDAP) 的 目 录 服 务 器 联 用 ， 与 域名 服务 器 (Domain Name Server，DNS) 联 用 。 

(8) 账单 管理 模块 (Biling Module)。 > 、> 

(9) 支持 的 附加 协议 包括 HL.225( 在 'Q.93T 基础 上 开发 的 呼叫 控制 协议 )、H.245( 多 媒体 
通信 控制 协议 ,于 :450( 畏 助 服务 协议 )、H.235( 安 全 ) 及 资源 管理 等 协议 。 


9.3.2 ”可 视 电 话 


可 视 电 话 是 利用 电话 线路 实时 传送 人 的 语音 和 图 像 (用 户 的 半身 像 、 照 片 、 物 国 二 的; -种 
通信 方式 。 如 果 说 普通 电话 是 “顺风 耳 ” 的 话 ， 则 可 视 电话 就 既是 “顺风 耳 ”， 又 是 “千里 眼 ” 
了 。 












































































































































“可 视 电话 ”这 个 术语 早 在 20 世纪 60 年 代 就 已 经 出 现 ， 人 们 一 直 和 孜孜 不 倦 地 追求 在 模拟 
电话 线路 上 实现 视听 通信 。 初 期 的 可 视 电 话 产品 需要 使 用 ISDN 电话 线 以 高 于 普通 模拟 电话 
线 的 速率 来 传输 电视 图 像 和 声音 ， 这 就 使 这 种 可 视 电 话 产品 的 推广 应 用 受到 限制 。 随 着 28.8 
kb/s 调制 解 调 器 的 出 现 ， 国 际 上 立即 就 开发 出 了 许多 在 模拟 电话 线 上 使 用 的 第 一 代 可 视 电话 
产品 。 可 是 一 个 公司 的 可 视 电 话 产品 与 另 一 个 公司 的 可 视 电 话 产品 不 能 相互 协同 工作 ， 这 就 
妨碍 了 产品 的 推广 。 

1. 可 视 电话 系列 标准 

为 解决 不 同 厂家 产品 的 兼容 性 问题 ， 开 发 了 一 个 可 视 电话 标准 一 一 H.324。 该 标准 现在 已 
被 国际 电信 联盟 采纳 并 作为 世界 可 视 电 话 标准 。 它 指定 了 一 种 普通 的 方法 ， 用 来 在 用 高 速 调 
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”市 解 调 吕 连接 的 设备 之 间 共 享 电视 图 像 声音 和 数据 。H.324 是 第 一 个 指定 在 公众 交换 电话 网 











络 上 实现 协同 工作 的 标准 。 这 就 意味 着 下 一 代 的 可 视 电话 产品 能 够 协同 工作 ， 并 且 为 市 场 增 
长 打下 了 基础 。 
H.324 系列 是 一 个 低位 速率 多 媒体 通信 终端 标准 ， 在 它 旗号 下 的 标准 包括 以 下 几 种 。 

(1) H.263: 电视 图 像 编 码 标准 ， 压 缩 后 的 速率 为 20 kb/s。 

(2) G723.1: 声音 编码 标准 ， 压 缩 后 的 速率 为 5.3Kb/s( 用 于 声音 十 数据 ) 或 者 6.3Kb/s。 

(3) H.223: 低位 速率 多 媒体 通信 的 多 路 复合 协议 。 

(4) H.245: 多 媒体 通信 终端 之 间 的 控制 协议 。 

(5) T120: 实时 数据 会 议 标 准 (可 视 电 话 应 用 中 不 一 定 是 必需 的 )。 

H.324 使 用 28.8kb/s 调制 解 调 器 来 实现 可 视 电 话 呼叫 者 之 间 的 连接 ， 这 与 PC 用 户 使 用 调 
制 解 调 器 和 电话 线 连接 Internet 或 者 其 他 在 线 服 务 的 通信 方式 类 似 。 调制 解 调 器 的 连接 一 旦 建 
立 ，H.324 终端 就 使 用 内 置 的 压缩 编码 技术 把 声音 和 电视 图 像 转 字 信 号 ， 并 且 把 这 些 信 
号 压缩 成 适合 模拟 电话 线 的 数据 速率 和 调制 解 调 器 连接 速率 的 数据 < 在 调制 解 调 器 的 最 大 数 
据 速率 为 28.8Kb/s 的 情况 下 ， 声 音 被 压缩 之 后 的 数据 率 大 约 为 `6Kb/s， 其 余 的 带宽 用 于 传输 
被 压缩 的 电视 图 像 。 .< 

2， 可 视 电话 产品 类 型 SN-、 

H.324 可 支持 各 种 类 型 的 采用 H.324 标准 的 可 视 电话 机 。 其 类 型 可 归纳 成 下 面 几 种 。 

(1) 标准 型 可 视 电话 /单机 型 可 视 电 话 (Standalone Video Phone): 这 种 产品 与 我 们 现在 使 用 
的 非 移动 型 和 移动 电话 类 似 ， 但 在 电话 机 贱 安 装 了 摄像 机 和 LCD 显示 器 如 图 9.3 所 示 。 

(2 太 基 于 TV 的 可 视 电 话 (TV:based Video Phone)， 这 种 产品 是 
-种 放 在 电视 机 上 的 多 媒体 电话 终端 它 有 内 置 摄像 机 , 使 用 电视 

入 和 机 作为 可 视 电 话 的 电视 显示 器 ; 
-1 G) 基于 PC EC besed Video Phone): 这 种 产品 实 
” 际 是 给 PC 添加 于 渤 种 功能 而 已 。 利用 PC 作为 可 视 电 话 终端 时 ， 
在 PC 上 需要 安装 执行 H.324 系列 标准 的 可 视 电话 软件 ， 需 要 配置 
图 像 数字 化 卡 和 声音 卡 作 为 图 像 和 声音 的 输入 /输出 设备 ， 用 彩色 
_ 显示 器 显示 电视 图 像 ,用 计算 机 内 部 的 处 理 器 对 电视 图 像 和 声音 进 
图 9.3 LCD 显示 器 电话 机 行 压缩 解压 缩 ， 并 且 用 28.8 kb/s 或 者 56 K 调制 解 调 器 连接 其 他 的 
可 视 电话 终端 ， 具 备 以 上 条 件 就 可 把 PC 当 作 一 个 可 视 电 话 终端 。 
H.324 可 视 电 话 的 声音 质量 接近 普通 电话 的 质量 。 按 H.324 标准 规定 , 电视 图 像 的 帧 速率 
取决 于 显示 的 图 像 大 小 。 例 如 ， 如 果 可 视 电 话 连接 双方 都 使 用 QCIF(176X 132) 的 图 像 分 辩 率 ， 
电视 图 像 的 帧 速率 可 达到 4 一 12 帧 /s, 接近 于 普通 电视 图 像 帧 速率 的 一 半 。 但 其 实际 的 帧 速率 
将 与 多 媒体 终端 的 计算 速度 、 用 户 选择 的 显示 窗口 大 小 及 当地 的 线路 质量 有 关 。 

H.324 可 视 电 话 几 乎 不 改变 人 们 使 用 电话 的 习惯 。 与 普通 电话 类 似 ， 把 可 视 电话 插入 到 办 
公 室 或 者 家 庭 的 电话 插座 中 ， 使 用 声音 呼叫 在 先 (Voice Call First) 的 方式 与 使 用 可 视 电 话 的 被 
呼叫 方 建立 连接 ， 这 是 最 简单 的 连接 方法 。 拨 打 可 视 电话 与 拨打 普通 电话 相同 ， 被 呼叫 方 一 
且 响 应 呼叫 ， 用 户 就 可 简单 地 在 可 视 电 话机 上 按 “ 连 接 键 ”， 或 者 在 基于 PC 的 可 视 电 话机 上 
按 “ 连 接 ” 键 就 可 以 选择 可 视 电话 方式 ， 进 行 “ 面 对 面 ”的 通话 。 

3. 可 视 电 话 支持 系统 

H.324 定义 的 多 媒体 电话 终端 可 运行 在 公众 交换 电话 网 络 上 ， 尽 管线 路 的 速率 受到 极 大 的 
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限制 ， 但 在 两 个 多 媒体 电话 终端 之 间 可 提供 实时 的 电视 图 像 、 声 音 、 数 据 或 者 任意 组 合 的 媒 





体 。 如 果 在 公用 电话 交换 网 络 上 安装 单独 的 多 点 控制 设备 ， 在 网 络 上 的 多 个 H.324 多 媒体 电 





话 终端 之 间 就 可 进行 多 点 通信 。H.324 定义 的 多 媒体 终端 也 可 与 综合 业务 数字 网 的 可 视 电话 系 
统 (定义 在 H.323 系列 标准 中 ) 和 移动 无 线 网 络 上 的 可 视 电话 系统 (定义 在 H.324/M 系列 标准 草 








案 中 ) 联 用 。 





部 件 组 成 : H.324 多 媒体 电话 终端 "PSTN 网 络 、 





4 多 媒体 电话 终端 ~ 














H.324 多 媒体 电话 as 324 定 义 的 模块 。 


H.324 本 》 块 包括 如 下 内 容 。- 


(1) 电视 编译 码 器 : 使 用 H.263 或 者 再 261 标准 对 电视 图 像 进行 编码 和 解码。 

(2) 声音 编译 码 器 :使 用 G723.1 标准 对 来 自传 声 器 的 声音 信号 进行 编码 ， 然 后 传输 到 对 
方 ， 并 且 对 来 自 对 方 的 声音 进行 译 码 ， 然 后 输出 到 麦克 风 。 图 中 “接收 通道 延 时 ”模块 用 于 
补偿 电视 信号 的 延 时 ， 以 维持 声音 和 电视 的 同步 。 

(3) 数据 协议 (V.14、LAPM 等 ): 支持 的 数据 应 用 可 包括 电子 白板 (Electronic Whiteboards)、 














> 六 H.324 rag 














H.324 多 媒体 可 视 电 话 终端 系统 如 图 9.4 所 示 。 从 图 9.4 中 可 以 看 到 ， 该 系统 由 下 面 几 个 














MCU 和 其 他 的 输入 /输出 部 件 。 





























静态 图 像 传输 、 数 据 库 访 问 、 声 图 远程 会 议 (Audiographics Conferencing)、 远 程 设备 控制 、 网 
络 协议 等 。 标 准 化 的 数据 应 用 包括 T.120( 用 于 实时 的 数据 加 声音 的 声 图 远程 会 议 )、T.80( 用 于 
简单 的 点 对 点 静态 图 像 文件 传输 )、T.434( 用 于 简单 的 点 对 点 文件 传输 )、H.224/H.281( 用 于 远 
端 摄像 机 控制 )、ISO/ITEC TR9577 网 络 协议 (包括 PPP 和 IP 协议 ) 及 使 用 缓存 的 V.14 或 者 
LAPM/V.42 的 用 户 数据 传输 。LAPM/V.42 是 定义 使 用 调制 解 调 器 链 路 访问 协议 (Link Access 




















Protocol for Modems) 的 错误 校正 方法 标准 。 支 持 的 其 他 协议 可 通过 H.245 协商 。 























(4) 控制 协议 (H.245): 提供 H.324 终端 之 间 的 通信 控制 。H.245 是 多 媒体 通信 控制 协议 ， 
它 定 义 流程 控制 、 加 密 、 拌 动 管理 ， 以 及 用 于 启动 呼叫 、 磋 商 双 方 要 使 用 的 特性 和 终止 呼叫 
等 信号 。 此 外 它 也 确定 那 一 方 是 发 布 各 种 命令 的 主 控 方 。 

(5) 多 路 复合 /多 路 分 解 (H.223): 它 提 供 两 种 功能 。 一 种 是 把 要 传送 的 电视 、 声 音 、 数 据 
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下 多 媒体 找 坟 六 其 应 用 第 之 服 ) 


__ 一 和 控制 流 复合 成 单一 的 数据 位 流 ， 另 一 种 功能 是 把 接收 到 的 单一 位 流 分 解 为 各 种 媒体 流 。 此 


外 ， 它 还 执行 逻辑 分 帧 (logical framing)、 顺 序 编号 、 错 误 检测 、 通 过 重 传 校正 错误 等 。 

(6) 调制 解 调 器 (V34/V8): 它 提供 两 种 功能 。 一 种 是 把 来 自 多 路 复合 /多 路 分 解 (H.223) 模 
块 的 同步 的 多 路 复合 输出 数据 位 流转 换 成 能 够 在 PSTN 网 络 上 传输 的 模拟 信号 ; 另 一 种 是 把 
接收 到 的 模拟 信号 转换 成 同步 数据 位 流 ， 然 后 送 给 多 路 复合 /多 路 分 解 (H.223) 模 块 进行 分 解 。 
调制 解 调 器 控制 (V.25 tenD 用 于 自动 应 答 设备 和 自动 呼叫 设备 的 通信 过 程 ， 其 中 的 ter 表示 第 三 
版 本 。V.8 是 在 PSTN 网 络 上 启动 数据 传输 会 话 过 程 的 协议 。 
在 图 9.4 所 示 的 多 媒体 系统 中 ， 下 列 系统 模块 虽 不 属于 H.324 标准 定义 的 范围 ， 但 又 是 
H.324 所 必需 的 。 这 些 模块 如 下 。 
(1) 电视 输入 /输出 设备 : 包括 摄像 机 、 监 视 器 、 数 字 化 器 和 它们 的 控制 部 件 。 

(2) 声音 输入 /输出 设备 : 包括 麦克 风 、 扬 声 器 和 常规 电话 用 到 的 部 件 。 

(3) 数据 应 用 设备 (如 计算 机 )、 非 标 准 化 的 数据 应 用 协议 和 像 电 条 白板 那样 的 远程 信息 处 
理 可 视 化 辅助 模块 。 A 

(4) PSTN 网 络 接口 : 支持 际 标准 定义 的 信号 传输 法 、 讽 铃 功能 和 信号 电压 规范 等 。 

(5) 用 户 系统 控制 、 用 户 界 面 和 操作 等 模块 。 /LA 下 六 

H.324 标准 定义 的 模块 很 多 ， 有 些 模块 在 不 同 的 应 用 环境 中 可 以 不 选择 ， 如 数据 协议 
(V14、LAPM 等 ) 模 块 。 但 必 不 可 少 的 模块 是 支持 H.263、 G723.1、H.223 和 H.245 协议 的 
模块 。 VQ 
































































































































SN 
9.3.3 ”电视 会 议 ,> >< 
1. H323 a K XL” 
1996 年 批准 的 H325 是 一 个 在 局 域 网 上 并 且 永 保证 Qos 的 多 媒体 通信 标准 .HL.323 多 许 声 


音 、 电 视图 像 和 数据 在 意 组 合 之 后 进行 传送 ; HL323 指定 包括 H.261 和 H.263 作为 电视 图 像 编 
码 器 , 指定 GT 722、G728、G729 和 G723.1 作为 声音 编码 器 。 此 外 , 还 包括 网 关 (gateway)、 
会 议 服务 器 (gatekeeper) 和 多 点 控制 设备 。H.323 广泛 支持 Internet 电话 。 
H.323 是 H.320 的 改进 版 本 。H.320 痔 述 的 是 在 ISDN 和 其 他 电路 交换 网 络 上 的 电视 会 议 
和 服务 。 自 从 1990 年 批准 以 来 ， 许 多 公司 已 经 在 局 域 网 开发 了 电视 会 议 ， 并 通过 网 关 扩 展 到 
广域网 ，H.323 就 是 在 这 种 情况 下 对 H.320 做 了 必要 的 扩充 。H.323 使 用 Internet 工程 特别 工作 
组 (Internet Engineering Task Force，IETF) 开 发 的 实时 传输 /实时 传输 控制 协议 (Realtime 
Transport Protocol / Real-Time Transport Control Protocol，RTP/RTCP)， 以 及 国际 标准 化 的 声音 
和 电视 图 像 编译 码 器 。1998 年 2 月 批准 的 H.323 版 本 2 也 正在 应 用 到 Intemet 上 的 多 点 和 点 
对 点 的 多 媒体 通信 中 。 

H.323 要 支持 以 前 的 多 媒体 通信 标准 和 设备 , 因此 扩充 后 比较 详细 的 拓扑 结构 如 图 9.5 所 
示 。 从 图 9.5 中 可 以 看 到 ，H.323 不 仅 在 局 域 网 上 通信 ， 而 且 还 可 通过 H.323 网 关 在 公众 交换 
电话 网 PSTN)、 罕 带 综合 业务 数字 网 (IN-ISDN) 的 终端 和 宽带 综合 业务 数字 网 (B-ISDN) 的 终端 
进行 通信 。 从 图 9.5 中 还 可 看 得 组 成 H.323 多 媒体 通信 系统 的 基本 部 件 包 括 H.323 终端 、H.323 
网 关 、H.323 会 务 器 和 H.323 MCU。 使 用 合适 的 代码 转换 器 ，H.323 网 关 还 可 支持 遵循 V70、 
H.324、H.322、H.320、H.321 和 H.310 标准 的 终端 。 



































































































































区 2 


多 媒体 通信 
MCU 
| I | 
H.323 H.323 H.323 H.323 
会 务 器 网 关 | 终端 终端 














运行 在 
H.321 方 式 下 
的 H.310 终 端 





图 9.5 H.323 拓扑 结构 、、 SC、 
; 六 | 

2，H.323 终端 人 AAA 
H.323 终端 是 局 域 网 上 的 客户 使 用 的 设备 ; 它 提供 实时 的 双向 通信 ， 它 的 组 成 部 件 如 图 9.6 
所 示 。 在 H.323 终端 中 ， 可 供 选择 的 标准 包括 电视 图 像 编 码 器 (H.263/H.261D)、 声 音 编码 器 
(G71X/G.72X/G.723.1)、T120 实时 数据 会 议 (Real Time Data Conferencing) 和 MCU 的 功能 。 但 
所 有 的 H.323 终端 都 必须 具备 声音 通信 的 功能 ， 而 电视 图 像 和 数据 通信 是 可 选择 的 。 H.323 
指定 了 在 不 同 的 声音 、 电 视图 像 和 数据 终端 在 一 起 于 作 时 所 需要 的 运行 方式 ， 是 新 一 代 












电视 图 像 
氢 像 机 / 编码 器 
显示 器 H 
| 局 域 网 
数据 设备 2 本 (LAN) 


系统 控制 
站 户 接口 


图 9.6 H.323 终端 结构 
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人 


| 各: 晤 … 


区 媒体 技术 发 其 应 用 (第 之 腑 ) 


一 ”所 有 了 323 终端 必须 支持 H.245 标准 。H.245 是 1998 年 9 月 批准 的 多 媒体 通信 控制 协议 ， 


它 定义 流程 控制 、 加 密 和 拌 动 管理 、 启 动 呼叫 信号 、 磋 商 要 使 用 的 终端 的 特性 和 终止 呼叫 等 
过 程 ， 它 也 确定 哪 一 方 是 发 布 各 种 命令 的 主 控 方 。 此 外 ，H.323 还 需要 支持 的 协议 包括 定义 呼 
叫 信 令 和 呼叫 建立 的 Q.931 标准 、 与 网 关 进 行 通信 的 注册 / 准 入 /状态 (RAS) 协 议和 实时 传输 / 
实时 传输 控制 协议 (RTP/RTCP)。 

3，H.323 网 关 


在 H.323 会 议 中 ， 网 关 是 一 个 可 选择 的 部 件 ， 因 为 如 果 电 视 会 议 不 与 其 他 网 络 上 的 终端 
连接 时 ， 同 一 个 网 络 上 的 终端 之 间 就 可 以 直接 进行 通信 。 网 关 可 建立 连接 的 终端 包含 PSTN 
终端 、 运 行 在 ISDN 网 络 上 与 H.320 兼容 的 终端 及 运行 在 PSTN 上 与 H.324 兼容 的 终端 。 终端 
与 网 关 之 间 的 通信 使 用 H.245 和 Q.931。H.323 网 关 提供 许多 服务 ， 但 最 基本 的 服务 是 对 在 
H.323 会 议 终端 与 其 他 类 型 的 终端 之 间 传 输 的 数字 信号 进行 转换 .这 个 功能 包括 传输 格式 之 间 
的 转换 (如 从 H.225.0 标准 到 H.221 标准 的 格式 转换 ) 和 通信 过 入 时 换 ( 如 从 H.245 标准 到 
H.242 标准 )。 此 外 ，H.323 tr 执行 呼叫 建立 和 
终止 呼叫 的 功能 。 图 9.7 表示 的 是 一 个 HH.323/PSTN 网 类- 一 

HS32WH.3 E 
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图 9.7 H.323 网 关 


在 H.323 标准 中 ， 对 许多 网 关 的 功能 都 没有 做 具体 的 限制 。 例 如 ， 能 够 通过 网 关 进 行 通 
信 的 实际 的 H.323 终端 数目 、SCN 的 连接 数目 、 同 时 支持 召开 的 电视 会 议 数 目 、 声 音 /电视 图 
像 /数据 转换 的 功能 等 ， 这 些 功 能 的 选择 和 设计 都 留 给 网 关 设 计 师 。 

4，H.323 会 务 器 


会 务 器 是 H.323 中 最 重要 的 部 件 ， 是 它 管辖 区 域 里 的 所 有 呼叫 的 中 心 控制 点 ， 并 且 为 注 
册 的 端点 提供 呼叫 控制 服务 。 从 多 方面 看 ，H.323 会 务 器 就 像 是 一 台 虚 拟 的 交换 机 。 
会 务 器 执行 两 个 重要 的 呼叫 控制 功能 。 一 个 是 定义 在 RAS 规范 中 的 地 址 转换 , 即 从 终端 别 
名 和 网 关 的 LAN 别名 转换 成 卫 或 者 网 际 信息 包 交 换 协议 (Internetwork Packet Exchange，IPX) 
地 址 ， 另 一 个 也 是 在 RAS 规范 中 定义 的 网 络 管理 功能 。 例如， 如 果 一 个 网 络 管理 员 已 经 设 定 
了 局 域 网 上 同时 召开 的 会 议 数目 ， 一 旦 超过 这 个 设 定 值 时 会 务 器 可 拒绝 更 多 的 连接 ， 以 限制 
总 的 会 议 带 宽 ， 其 余 的 带宽 用 于 电子 邮件 、 文 件 传输 和 网 上 的 其 他 应 用 。 由 单个 会 务 器 管理 
的 所 有 终端 、 网 关 和 多 点 控制 单元 (MCU) 的 集合 被 称 为 H.323 区 域 (H.323 Zone)。 这 个 概念 如 
图 9.8 所 示 。 
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图 9.8 会 务 器 的 概念 表示 图 


会 务 器 的 一 个 可 供 选 择 但 有 价值 的 特性 是 它 可 安排 H.323 的 呼叫 。 这 个 特性 便于 服务 提 
供 者 管理 使 用 他 们 的 网 络 进行 呼叫 的 账目 ， 也 可 以 在 被 呼叫 端点 不 能 使 用 的 情况 下 把 呼叫 转 
接 到 另 一 个 端点 。 此 外 ， 这 个 特性 还 可 用 来 平衡 多 个 路 由 器 之 间 的 呼叫 负荷 。 
在 H.323 系统 中 ， 会 务 器 不 是 必需 的 。 但 如 果 有 会 务 器 存在 ， 终 端 必须 要 使 用 会 务 器 提 
供 的 服务 功能 。 这 些 功 能 就 是 地 址 转换 、 准 入 控制 、 带 宽 管 理 和 区 域 管理 。 

5.，H.323 多 点 控制 单元 答 

多 点 控制 单元 (MCU) 支 持 在 3 个 或 者 3 个 以 上 的 二 点 共 相 和 电视 会 议 。 在 H.323 电视 
会 议 中 ， 一 个 MCU 由 多 点 控制 器 (Multipoint Contiglisfy MC) 和 n(n 之 0) 个 多 点 处 理 器 
(Multipoint Processors，MP) 组 成 。MC 处 理 H.245 推荐 标准 中 指定 的 在 所 有 终端 之 间 进行 协商 
的 方法 ， 以 便 确定 在 通信 过 程 中 共 同 使 用 的 声 谷 和 电视 图 像 的 处 理 能 力 。 MC 也 控制 会 议 资源 ， 
Wr et 不 直接 处 理 任何 媒体 流 。MP 处 理 媒体 的 混 
合 及 处 理 声音 数据 、 ss MC 和 MP 可 以 作为 单独 的 部 件 或 者 集成 到 其 
他 的 H.323 部 件 。 2 


6 本 323 多 点 电视 会 议 A 

pe WK 
按照 HL.323 标准 ,7 可以 召开 各 种 形式 的 多 点 弟 视 会 议 ， 如 图 9.9 所 示 。H.323 标准 可 支持 
的 会议 形式 包括 由 D<E 和 下 终端 参加 的 集 市 式 电视 会 议 ， 由 A、B 和 C 终端 参加 的 分 数 式 
电视 会 议 ， 声 像 集散 混合 式 多 点 电视 会 议 ， 会 议 集散 混合 式 多 点 电视 会 议 。 图 99 中 的 多 点 
控制 单元 (MCU) 企 这 些 会 议 中 起 桥梁 作用 。 
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图 9.9 H.323 MCU 
在 集中 式 电视 会 议 (Centralized Multipoint Conference) 中 ,需要 一 个 MCU 来 管理 多 点 会 议 ， 
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本 
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“多 天 你 搁 术 坟 真 应 用 (第 2 服 ) 








_ 一 所 有 终端 都 要 以 点 对 点 的 方式 向 MCU 发 送 声音 、 电 视图 像 、 数 据 和 控制 流 。MCU 中 的 MC 集 

















中 管理 使 用 H.245 控制 功能 的 电视 会 议 , 而 MP 处 理 声音 混合 、 数据 分 发 、 电 视图 像 切换 /混合 ， 
并 且 把 处 理 的 结果 返回 给 每 个 与 会 终端 。MP 也 提供 转换 功能 , 用 于 在 不 同 的 编译 码 器 和 不 同 
的 位 速率 之 间 进 行 转换 ， 并 且 可 使 用 多 目标 广播 方式 发 送 经 过 加 工 的 电视 。 

在 分 散 式 电视 会 议 (Decentralized Multipoint Conference) 中 , 与 会 终端 以 多 目标 广播 的 方式 
向 没有 使 用 MCU 的 所 有 其 他 与 会 终端 广播 声音 和 电视 图 像 。 与 会 终端 响应 和 显示 综合 接收 
到 的 声音 及 选择 一 个 或 者 多 个 接收 到 的 电视 图 像 ， 而 多 点 数据 的 控制 仍然 由 MCU 集中 处 理 ， 
H.245 控制 信道 (H.245 Control Channel) 信 息 仍然 以 点 对 点 的 方式 传送 到 MC。 

声 像 集 散 混合 式 多 点 电视 会 议 (Hybrid Multipoint Conference) 有 两 种 形式 ， 即 声音 集中 广 
播 混 合式 多 点 电视 会 议 (Hybrid Multipoint Conference-Centralized Audio) 和 电视 集中 广播 混合 
式 多 点 电视 会 议 。 在 前 一 种 形式 中 ,终端 以 多 目标 广播 形式 向 其 他 与 会 终端 播放 他 们 的 电视 ， 
而 以 单 目标 广播 形式 把 声音 传送 给 MCU 中 的 MP， 然 后 由 MP 把 声音 流 发 送 给 每 个 终端 。 在 
后 一 种 形式 中 ， 终 端 以 多 目标 广播 形式 向 其 他 与 会 终端 播放 他 们 的 声音 ， 而 以 单 目标 广播 形 
式 把 电视 图 像 传送 给 MCU 中 的 MP 进行 切换 和 混合 ， 然后 由 MP 把 电视 图 像 流 发 送 给 每 个 终 
端 。 混 合式 电视 会 议 组 合 使 用 了 集中 式 和 分 散 式 电视 会 议 的 特性 。 














































































































会 议 集散 混合 式 多 点 电视 会 议 (Mixed Multipoint Conferences) 是 由 以 集中 方式 召开 的 会 议 
(如 图 9.8 中 的 D、E 和 下 参 力 ) 和 以 分 散 方式 召开 的 会 议 ( 如 图 9.8 中 的 A、B 和 C 参加 ) 组 合 





x 





的 一 种 会 议 形式 。 
7，H.323 协议 堆 NS- 


\ 





如 图 9.10 所 示 。 从 图 9.10 中 可 以 看 到 ，H.323 协议 堆放 号 的 控制 和 数据 信息 通过 可 靠 的 传输 
传输， 而 声音 数据 、 电 视 数 据 、 声 音 /电视 的 控制 信息 ， 以 及 部 分 会 务 控 






山 视 





9.10 “H.323 协议 堆 结构 


这 些 协 议 可 通过 软件 集成 到 分 组 交换 网 络 的 协议 堆 中 ， 因 此 可 在 分 组 交换 网 络 上 进行 实 
时 的 多 媒体 通信 。 按照 H.323 标准 构造 的 部 件 可 在 IP 网 络 上 建立 呼叫 、 交 换 压 缩 的 声音 /电视 
数据 和 召开 会 议 ， 并 且 还 能 够 与 非 H.323 端点 进行 通信 。 











276 





9.3.4 VOD 系统 
1. VOD 系统 模型 


VOD 系统 也 称 交互 式 电视 点 播 系统 。VOD 是 计算 机 技术 、 网 络 技术 、 多 媒体 技术 发 展 
的 产物 ， 是 一 项 全 新 的 信息 服务 。 它 摆脱 了 传统 电视 受 时 空 限制 的 束缚 ， 解 决 了 想 看 什么 节 
目 就 看 什么 ， 想 何 时 看 就 何 时 看 的 问题 。 有 线 电视 VOD 是 指 利 用 有 线 电 视 网 络 , 采用 多 媒体 
技术 ， 将 声音 、 图 像 、 图 形 、 文 字 、 数 据 等 集成 为 一 体 ， 向 特定 用 户 播放 其 指定 的 视听 节目 
的 业务 活动 ， 包 括 按 次 付费 、 轮 播 、 按 需 实时 点 播 等 服务 形式 。 这 种 新 的 多 媒体 信息 服务 形 
式 被 广泛 应 用 于 有 线 电视 系统 、 远 程 教育 系统 及 各 种 公共 信息 咨询 和 服务 系统 中 。VOD 系统 
采用 C/S(Client/Server) 模 型 ， 如 图 9.11 所 示 。 它 主要 由 如 下 3 部 分 组 成 。 


视频 服务 器 视频 服务 器 | … 视频 服务 器 

































































































视频 服务 器 视频 服务 只 
| ph 基于 C/S 的 VoD Fall 


(1) 视频 服务 器 : 位 天 VoD 中 心 ， 存 储 大 量 的 区 媒体 信息 息 ,根据 客户 的 点 播 请求 ， 把 所 

涝 的 多 伐 体 信息 实时 地 传送 给 客户 。 根据 系统 规 大 小 ， 可 采用 单一 服务 器 或 集群 服务 器 

结构 来 实现 。,、/ /> 

(2) 高 过 刚 容 为 视频 服务 器 和 客户 之 间 的 信 息 交换 提供 高 带宽 、 低 延迟 的 网 络 传输 服务 。 

(3) 客户 端 用 户 访问 视频 服务 器 的 工具 ,可 以 是 机 顶 盒 或 计算 机 ， 用户 通过 交互 界面 将 

点 播 请 求 发 送 给 视频 服务 器 ， 以 及 接收 和 显示 来 自视 频 服务 器 的 多 媒体 信息 。 

VOD 系统 是 一 种 基于 C/S 模型 的 点 对 点 实时 应 用 系统 ,视频 服务 器 可 同时 为 很 多 用 户 提 

供 点 对 点 的 即时 VOD 服务 , 并 且 信 息 交 互 具有 不 对 称 性 , 客户 到 视频 服务 器 的 上 行 信道 的 通 

信 量 要 远 远 小 于 视频 服务 器 到 客户 的 下 行 信道 的 通信 量 。 

系统 响应 时 间 是 VOD 系统 的 重要 性 能 指标 , 主要 取决 于 视频 服务 器 的 吞吐 能 力 和 网 络 带 

宽 。 根 据 系统 响应 时 间 长 短 , VOD 系统 可 分 为 真 点 播 TVOD(True VOD) 和 准点 播 NVOD(Near 

VOD) 两 类 。 

TVOD 要 求 有 严格 的 即时 响应 时 间 ， 从 发 出 点 播 请 求 到 接收 到 节目 应 小 于 1s， 并 提供 较 

完备 的 交互 功能 ， 如 对 视频 的 快 进 、 快 退 和 慢 放 等 。TVOD 允许 随机 地 、 以 任意 间隔 对 正在 

播放 的 视频 节目 帧 进行 即时 访问 ， 这 就 对 视频 服务 器 的 CPU 处 理 能 力 、 缓 存 空间 和 磁盘 IO 
吞吐 量 及 网 络 带宽 提出 很 高 的 要 求 。 

NVOD 对 系统 响应 时 间 有 一 定 的 宽 限 ， 从 发 出 点 播 请 求 到 接收 到 节目 一 般 在 几 秒 到 几 分 

钟 ， 甚 至 更 长 ， 只 要 能 被 用 户 接受 即 可 。NVOD 将 视频 节目 分 成 若干 时 间 段 而 不 是 帧 进行 播 

放 ， 以 及 快 进 、 快 退 和 慢 放 等 操作 ， 时 间 段 比 帧 的 粒度 大 ， 从 而 降低 了 对 系统 即时 响应 的 要 
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一 求 ， 但 系统 的 造价 低 且 支持 的 客户 较 多 。 目 前 很 多 VOD 系统 产品 都 采用 NVOD 方式 。 


无 论 TVOD 还 是 NVOD， 当 系统 规模 较 大 时 ， 单一 服务 器 的 处 理 能 力 和 系统 资源 就 很 难 
满足 用 户 需 求 ， 必 须 通 过 集群 服务 器 来 改进 系统 性 能 ， 提 高 服务 质量 。 

通常 一 个 VOD 系统 可 以 为 用 户 提供 如 下 VOD 服务 。 

(1) 影视 点 播 : 点 播 电 影 或 电视 节目 ， 用户 可 以 通过 快 进 、 快 退 和 慢 放 等 控制 功能 控制 播 

(2) 信息 浏览 : 浏览 各 种 商品 购物 和 广告 信息 ， 或 查看 股票 、 证 券 和 房地产 行情 等 信息 。 

(3) 远程 教育 : 网 3 和 节目， 选择 课程 和 内 容 ， 做 练习 ， 模 拟 考试 ， 自 我 测试 。 

(4) 交互 游戏 : 将 视频 游戏 下 载 到 用 户 终端 上 ， 用 户 可 以 和 远程 的 其 他 用 户 一 起 参加 

随 着 网 络 环境 的 改善 和 VOD 技术 的 成 熟 ，VOD 的 应 用 领域 将 会 得 到 进一步 拓展 ， 尤 其 
是 在 Internet 的 应 用 具有 广阔 的 前 景 。 伦 

2，VOD 系统 关键 技术 CN 


VOD A 妥 务 器 和 用 户 接纳 控制 等 。 

1) 网 络 支 撑 环 境 

VOD 系统 是 一 种 基于 C/S 模型 的 点 对 点 : SS 视频 服务 器 可 同时 为 很 多 用 户 提 
供 点 对 点 的 即时 VOD 服务 。 为 了 获得 较 高 的 视频 和 音频 质量 ， 要 求 网 络 基础 设施 能 提供 高 带 
宽 、 低 延迟 和 支持 QoS 等 的 传输 特性 。 et 如 ATM、 高 
速 交 换 式 LAN 或 者 高 速 光纤 WAN 和 ;信之 具有 较 高 的 网络 于 量 ， 

VOD 系统 的 网 络 环境 可 以 是 LAN 也 可 以 是 WAN 在 | LAN 环境 下 应 用 VOD 系统 时 ,多 
媒体 的 传 9 Qos, 从 有 : 般 能 够 得 到 保证 。 而 自前 的 WAN 环境 (如 Internet) 却 很 难保 证 
VOD 系统 的 QoS。 从 发 展 角 度 来 看 , Internet (将 是 VOD 应 应 用 的 广阔 空间 , 但 必须 解决 Internet 
高 速 化 问题 。 “人 x 

另外 ， VOD 系 启用 电视 CA 徐 上 应 用 ， 但 必须 解决 两 个 问题 ， 一 是 将 CATV 
网 的 单 向 通道 履行 成 双向 通道 (上 行 通道 和 下 行 通道 ); 二 是 使 用 适当 的 用 户 接 入 设备 (如 Cable 
Modem 等 ) 来 连接 CATYV 网 。 

2) 视频 服务 器 

视频 服务 器 是 VOD 系统 的 核心 部 件 ， 存 储 大 量 的 多 媒体 信息 ， 并 支持 很 多 用 户 的 并 发 访 
问 。 视 频 服务 器 的 性 能 要 求 主要 表现 在 如 下 几 个 方面 。 

(1) 信息 存储 组 织 。 视 频 和 音频 信号 经 过 数字 化 后 变 成 了 一 系列 的 视频 帧 和 音频 采样 序 
列 ， 经 过 编码 后 变 成 媒体 流 ， 作 为 视频 服务 器 的 信息 存储 和 访问 对 象 。 由 于 数据 量 大 ， 对 信 
息 的 存储 和 传输 都 提出 了 很 高 的 要 求 。 因 此 ， 服 务 器 中 的 信息 存储 组 织 和 磁盘 IO 吞吐 量 将 
影响 到 整个 系统 的 响应 速度 。 

为 了 支持 更 多 用 户 并 发 访问 信息 ， 提 高 服务 器 的 响应 速度 ， 通 常 视频 服务 器 应 采用 磁 稚 
阵列 (RAID)， 并 通过 条 纹 化 技术 ， 把 媒体 数据 交叉 地 放 在 磁盘 阵列 的 不 同 盘 片 上 ， 以 提高 服务 
器 IO 吞吐 量 。 由 于 大 多 数 媒 体 流 采 用 的 是 可 变速 率 (VBR) 数 据 压 缩 算法 ， 如 MPEG， 因 此 所 
需 的 存储 空间 可 能 会 跨越 不 同 的 媒体 单元 。 

(2) 信息 获取 机 制 。 视 频 服务 器 应 当 提供 一 系列 的 优化 机 制 ， 在 确保 QoS 的 前 提 下 ， 使 
媒体 流 的 吞吐 量 达 最 大 程度 。 在 客户 端 ， 用 户 从 服务 器 获取 信息 的 速度 必须 大 于 消费 信息 的 
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速度 ; 在 服务 器 端 ， 必 须 确保 在 QoS 允许 的 时 间 
种 机 制 
在 Server-push 机 制 中 ， 
服务 周 








服务 器 利用 了 需要 
期 内 可 以 为 多 个 媒体 流 提供 服务 。 在 每 个 周期 内 ， 
数量 的 媒体 单元 。 为 了 确保 媒体 流 
满足 回放 的 速度 和 在 一 个 周期 内 的 回 
足 多 个 信息 需要 的 响应 做 批 处 理 ， 

对 于 Client-pull 机 制 
求 。 为 了 确保 媒体 流 的 连续 回放 ， 客 户 端 必须 周期 性 地 向 
必须 事先 预计 服务 器 提供 的 信息 
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“| 
范围 内 为 每 个 用 户 进行 服务 。 通 常 ， 采 
来 获取 媒体 流 ， 那 就 是 服务 器 “ 推 ”(Server-push) 和 客户 “ 拉 ”(Client-pull)。 

放 的 媒体 流 的 连续 性 和 周期 性 特点 ， 在 一 个 
及 务 器 必须 为 每 个 媒体 流 提供 
的 连续 回放 ， 服 务 器 为 每 个 媒体 流 提供 的 媒体 单元 数 必 
放 时 间 。Server-push 机 制 允 许 服务 器 在 一 个 
并 可 以 从 整体 上 对 批 处 理 做 出 优化 。 

， 服 务 器 需要 为 客户 提供 的 媒体 单元 数 ， 











机 制 更 适合 对 处 理 器 和 网 络 带 宽 资 源 经 常 变化 的 服务 请 求 。 


大 量 用 户 并 发 访问 
并 作为 一 个 整体 向 
集群 服务 器 一 般 应 具有 负载 均衡 和 系统 容错 功能 
将 整个 系统 的 负载 均衡 地 分 配 在 不 同 的 服务 器 上 ， 0 
分 配 两 种 ， 动 态 负 玫 
硬件 几 余 和 数据 备份 的 手段 保 ee 

林 简 服务 可 二 的 各 个 服务 本 要 所 系统 人 SA 作 
， 其 他 服务 器 将 会 


3 
3， 用 户 接纳 控制 


a VOD 服务 
适 的 接纳 控制 (A ission Control) 
D) 


的 用 户 讨 求 的 Qo S 不 受 影响 。 接 纳 
确定 型 接纳 控制 
根据 系统 资源 的 使 


算法 
以 确保 能 够 满足 当前 正在 接受 
2) 统计 型 接纳 控制 算法 



































须 使 
受 服务 
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莹 


按照 某 种 统计 算法 对 一 定数 量 的 服务 请 求 (如 60%) 做 出 最 坏 估计 ， 





王 


接纳 新 的 服务 请 求 。 
容忍 QoS 在 一 定 范围 的 波动 。 
3) 测量 型 接纳 控制 算法 









































算法 对 
据 系统 对 
系统 应 当 根据 不 同 的 
4. VOD 系统 组 成 
VOD 系统 主要 由 显示 系统 、 机 项 盒 、 


图 


VOD 系统 结构 图 。 


的 利用 率 最 高 ， 



































户 需求 提供 相应 的 接纳 控制 算法 。 
































肛 务 器 的 需要 。 集 群 服务 器 将 多 个 服务 器 通过 


(3) 集群 服务 器 结构 。 单 个 服务 器 不 仅 存储 容量 有 限 ， en 
户 提供 信息 服务 ， 人 全 全 和 1 


人 


i 策略 有 静态 
分 本 策略 具有 较 好 的 动态 特 信 但 和 法 复 杀 。 费用 
靠 性 和 系统 运行 的 不 间 
ee 
RT NT 


a 
保证 在 接受 该 服务 请 求 后 使 系统 中 正在 搂 
可 以 分 成 下 列 3 类。 


情况 做 最 坏 的 估计 ， 在 最 坏 的 情况 下 ， 接 纳 一 个 新 的 


统计 型 接纳 控制 算法 的 资源 利用 率 比 确定 型 的 高 ， 但 是 要 求 


宽带 互动 网 络 系统 等 组 成 。 


只 需 满足 客户 
R 务 器 提交 需求 ， 每 个 提交 的 需求 
\ 量 和 服务 响应 时 间 ， 保 证 媒体 流 播 放 的 连续 性 。 


可 扩 


第 9 章 
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固 





周期 内 对 








络 连 接 起 来 协同 工作 ， 








展 性 




















断 性 。 在 正常 
如 果 某 一 








高 。 系 统 容错 是 采用 





工作 时 ， 
R 务 器 发 生 故 


寺 ， 服 务 器 必 











务 请 求 必须 


服务 的 所 有 服务 请 求 的 QoS 为 前 提 。 这 是 最 差 的 接纳 控制 算法 。 


只 要 系统 资源 允许 ， 
六 




















对 系统 资源 的 过 去 使 用 情况 进行 分 析 ， 得 到 一 个 综合 测量 值 ， 根 据 这 个 测量 值 ， 对 未 来 
情况 做 出 估计 ， 以 决定 是 否 接纳 新 的 服务 请 求 。 在 这 3 种 接纳 控制 算法 中 ， 
但 是 对 用 户 的 QoS 保障 最 低 。 也 就 是 说 ， 接 乡 
户 所 承诺 QoS 的 可 信 度 来 划分 的 , 承诺 的 可 信 度 越 高 , 对 资源 的 利 


测量 型 接纳 
控制 算法 是 根 
率 就 会 越 低 。 
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9.12 是 一 个 简化 的 
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库 注 凡 


的 突 发 性 要 
Client-pull 


也 难 以 满足 


适当 的 负载 均衡 策略 
负载 分 配 和 动态 负载 





有 
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| _ 节 十 特定 流 
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| PoS/ATE/ | 

| 直接 光 传输 | 边 ; 










必 影 NC2 一 20Mb/s) 
| IPIUDP 包 ) 





图 9.12 VOD 系统 结构 图 


1) VOD 系统 的 显示 系统 
VOD 系统 的 显示 系统 可 由 传统 的 AV 声 像 系 统 及 计算 机 担当 ;于 般 来 说 ， 欣 赏 影视 片 用 
传统 的 AV 声 像 系 统 效果 较 好 , 查询 办 公 资 料 用 计算 机 较 好 、 较 方便 < 图 9.13 给 出 了 一 个 VOD 








点 歌 系 统 的 界面 图 。 A 
2) VOD 系统 的 机 顶 盒 , 
VOD 系统 的 机 顶 盒 (Set Top Box，STB) 就 是 二 种 数据 处 理 装 置 ， 如 图 9.14 所 示 ， 一 方面 

把 VOD 网 络 上 传 过 来 的 数字 信号 转换 成 传统 的 AV, 声 像 系 统 可 播放 的 多 媒体 声 像 信号 , 一 方 

面 把 VOD 用 户 的 点 播 指令 上 传 到 网 络 上 /指控 信息 的 播放 。 普 通 计算 机 加 装 VOD 专用 处 理 

卡 及 相应 软件 ， 即 可 起 到 机 项 盒 的 作用 :机顶盒 一 般 要 配备 遥控 器 以 方便 用 户 使 用 。 


























友 耳 行 7 已 遍 8.- 新 歌 9 高 级 0D 酒水 
轩 人 人 = 


图 9.13 VOD 点 歌 系统 图 9.14 机 项 盒 


3) VOD 系统 的 宽带 互动 网 络 系统 

VOD 系统 的 宽带 互动 网 络 系统 由 VOD 网 络 、VOD 服务 器 、VOD 软件 组 成 ， 起 到 两 个 
作用 ， 即 双向 传输 多 媒体 数字 信号 和 点 播 指令 、 在 服务 器 端 储存 及 播放 多 媒体 信息 。 

目前 ， 流 行 的 有 两 大 VOD 网 络 系统 ， 即 有 线 电视 系统 和 卫 计算 机 网 络 系统 。 

目前 的 发 展 状 况 是 有 线 电视 系统 技术 及 设备 一 直 不 成 熟 ， 在 试验 应 用 中 系统 不 稳定 ， 功 
能 单一 、 扩 展 性 较 差 、 升 级 换代 不 易 ， 网 络 与 设备 复杂 ， 需 要 对 单 向 有 线 电视 网 络 进行 双向 
网 络 改造 ， 造 价 难以 下 降 ， 系 统 用 户 数量 难以 很 大 (同时 上 千 户 )， 没 有 全 球 性 统一 标准 ， 与 
Intemet、 计 算 机 多 媒体 信息 互通 与 转换 复杂 ， 难 以 做 到 统一 信息 平台 ， 也 很 难 跟 上 计算 机 网 
络 技术 的 飞速 发 展 ， 因 此 ， 一 直 没 有 较 好 的 应 用 实例 ， 也 难 有 很 好 的 发 展 前 景 。 

架构 于 IP 计算 机 网 络 系统 的 VOD 系统 则 是 最 有 发 展 前 景 的 系统 ， 上 述 有 线 电 视 系 统 的 
弱点 它 都 不 存在 ， 相 反 ， 是 该 系统 的 优势 。VOD 的 产生 本 来 就 来 自 于 IP 计算 机 网 络 系统 。 
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i 
多 天 条 对 


当初 人 们 想 用 有 线 电视 系统 来 实现 VOD， 是 为 了 借用 已 有 的 有 线 电视 系统 ， 即 省 去 对 计算 机 
网 络 的 投资 , 又 拥有 庞大 的 现成 用 户 , 但 在 计算 机 网 络 投资 越 来 越 便宜 ，Internet 越 来 越 普及 、 
电子 商务 、 家 庭 办 公 越 来 越 多 地 受到 人 们 欢迎 的 今天 ， 当 初 采 用 有 线 电视 系统 的 理 已 不 复 
存在 。 相 反 IP 计算 机 网 络 系统 成 了 酒店 、 企 事业 单位 、 小 区 一 步 到 位 的 综合 型 信息 平台 ， 量 
升级 换代 极为 容易 ， 保 护 了 用 户 的 前 期 投资 。 


9.3.5 IP 电话 
















































































IP 电话 (IP Telephony)、Internet 电话 (Internet Telephony) 和 VoIP(Voice over IP) 都 是 在 IP 网 
络 即 分 组 交换 网 络 上 进行 的 呼叫 和 通话 ， 而 不 是 在 传统 的 公众 交换 电话 网 络 上 进行 的 呼叫 和 
通话 。 当 前 ，IP 电话 用 于 长 途 通信 时 的 价格 比 PSNT 电话 的 价格 便宜 得 多 , 但 质量 也 比较 低 。 
尽管 质量 不 尽 如 人意 ， 但 由 于 价格 上 的 优势 ，I 电话 仍然 是 最 近 几 年 来 全 球 多 媒体 通信 中 的 
一 个 热点 技术 。 入 
在 分 组 交换 网 络 上 传输 声音 的 研究 始 于 20 世纪 70 年 代 末 和 和 80 年 代 初 ， 而 真正 开发 PP 
电话 市 场 始 于 1995 年 ，VocalTec 公司 率先 使 用 PC 软 在 JP 网 络 的 两 台 PC 之 间 实 现 通话 。 
1996 年 ， 科 技 人 员 在 IP 网 络 和 PSTN 网 络 之 间 的 用 户 RE 。1997 年 出 现 具 
有 电话 服务 功能 的 网 关 ，1998 年 出 现 具 有 电话 会 议 服 务 功能 的 会 务 器 ，1999 年 开始 应 用 人 
电话 ,2000 年 开始 IP 电话 用 在 了 移动 IP 网 络 SR te Packet Radio 
Service，GPRS) 或 者 通用 移动 ER Mobile Telecommunications System，UMTS)。 
P 电话 允许 在 使 用 TCP/IP 协议 的 mtemet、 内 联网 或 者 专用 LAN 和 WAN 上 进行 电话 交 
谈 。 内 联网 和 专用 网 络 可 提供 比较 好 的 通话 质量 ， 与 与 公用 突 电话 网 提供 的 声音 质量 可 以 媳 
美 。 在 Internet 上 目前 坏人 提供 与 专用 网 络 或 者 ESTN 那样 的 通话 质量 ， 但 支持 保证 QoS 
的 协议 有 望 改善 这 种 状况 。 在 Intemet 上 的 他 电话 又 称 Internet 电话 , 它 意味 着 只 要 收发 双方 
使 用 同样 的 专 有 软件 或 者 使 用 与 H.323 标准 兼容 的 软件 就 可 以 进行 自由 通话 。 通 过 Internet 
电 活 服务 提供 der et Telephony Service Providers, ITSP), 用 户 可 以 在 PC 与 普通 电话 (或 可 
视 电 话 ) 之 间 通 过 IP 网 络 进行 通话 。 从 技术 上 看 ,“VoIP” 比 较 侧重 于 指 声音 媒体 的 压缩 编码 
和 网 络 协议 ， 而 “IP Telephony” 比 较 侧重 于 指 各 种 软件 包 、 工 具 和 服务 。 

1.IP 电话 与 PSTN 电话 的 技术 差别 


为 了 解 他 电话 和 PSTN 电话 在 技术 上 的 差别 , 首先 要 了 解 在 IP 网络 上 传送 声音 的 基本 过 
程 。 如 图 9.15 所 示 ， 拨 打 IP 电话 和 在 IP 网络 上 传送 声音 的 过 程 可 归纳 如 下 。 

来 自 麦克 风 的 声音 在 声音 输入 装置 中 转换 成 数字 信号 ， 生 成 “编码 声音 样本 ”输出 。 

这 些 输出 样本 以 帧 为 单位 (如 30 ms 为 一 帧 ) 组 成 声音 样本 块 ， 并 复制 到 缓冲 存储 器 。 

IP 电话 应 用 程序 估算 样本 块 的 能 量 ， 静 音 检测 器 根据 估算 的 能 量 来 确定 这 个 样本 块 是 作 
为 “静音 样本 块 ” 来 处 理 还 是 作为 “说 话 样本 块 ” 来 处 理 。 

如 果 这 个 样本 块 是 “说 话 样 本 块 ” 就 选择 一 种 算法 对 它 进 行 压缩 编码 , 算法 可 以 是 H.323 
中 推荐 的 任何 一 种 声音 编码 算法 或 者 全 球 数 字 移 动 通信 系统 (Global System for Mobile 
Communications，GSM) 中 采用 的 算法 。 

在 样本 块 中 插入 样本 块头 信息 ， 然 后 封装 到 用 户 数据 包 协 议 套 接 接口 (Socket Interface) 成 
为 信息 包 。 
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到 


区 媒 订 技 坟 发 其 应 用 (第 之 腑 ) 


将 样本 / 
声音 样本 








图 9.15 IP 电话 的 通话 过 程 。 KK 














信息 包 在 物理 网 络 上 传送 。 在 通话 的 另 一 方 接收 Lb 去 掉 样 本 块头 信息 ， 使 
用 与 编码 算法 相反 的 解码 算法 重 构 声 音 数据 ， A 存储 器 。 
从 缓冲 存储 器 中 把 声音 复制 到 声音 输出 设备 换 成 模拟 声音 ， 完 成 一 个 声音 样本 块 的 传送 。 








从 原理 上 说 ，IP 电话 和 PSTN Ni 上 的 主要 差别 是 它们 的 交换 结构 。Internet 
使 用 的 是 动态 路 由 技术 , 而 PSTN 使 前 是 态 交 换 技术 。 PSTN 电话 是 在 电路 交换 网 络 上 进 
行 ， 对 每 对 通话 都 分 配 一 个 固定 的 因此 通话 质量 有 保证 。 在 使 用 PSTN 电话 时 ， 呼 叫 
方 拿 起 收 /发 话 器 ， 拨 打 被 呼叫 放 的 外 和 色 、 地 区 码 和 市 区 爱 码 ， 通 过 中 央 局 建立 连接 ， 然 后 
双方 就 可 进行 通话 。 在 使 用 包 电话 时 ， 用 户 输入 的 下 | 话 号 码 转发 到 位 于 专用 小 型 交换 机 
(Private Branch Exchange, PBX) 和 TCP/IP 网 络 之 间 最 近 的 IP 电话 网 关 ，IP 电话 网 关 查 找 通 
过 Intemet 到 达 被 呼叫 号 码 的 路 径 ,然后 建 间 格 i> IP 电话 网 关 把 声音 数据 装配 成 IP 信息 包 ， 
然后 按照 TCP a eh IP 信 息 包 发 送出 去 。 对 方 的 人 P 电话 网 关 接 收 到 这 种 
IP 信息 包 之 后 , 将 信息 包 还 原 成 原来 的 声音 数据 ， 并 通过 PBX 转发 给 被 呼叫 方 。 

2.，IP 电话 的 通话 方式 

IP 电话 真正 大 量 投入 时 , 估计 会 有 3 种 基本 的 通话 方式 : 在 IP 终端 (计算 机 ) 之 间 的 通话 、 
IP 终端 与 普通 电话 (或 可 视 电话 ) 之 间 通过 IP 网 络 和 PSTN 网 络 的 通话 ,以 及 普通 电话 (或 可 视 
电话 ) 之 间 通 过 IP 网 络 和 PSTN 网 络 的 通话 。 

IP 终端 之 间 的 通话 方式 如 图 9.16 所 示 。 在 这 种 通话 方式 中 ， 通 话 收发 双方 都 要 使 用 配置 
了 相同 类 型 的 或 者 兼容 的 IP 电话 软件 和 相关 部 件 ， 如 声卡 、 麦 克 风 、 扬 声 器 等 。 声 音 的 压缩 
和 解压 缩 由 PC 承担 。 
















































































站 终端 起 次 端 
图 9.16 IP 终端 与 IP 终端 之 间 的 通话 
IP 终端 与 电话 终端 之 间 的 通话 方式 如 图 9.17 所 示 。 在 这 种 通话 方式 中 ， 通 话 的 一 方 使 用 




















| 


配置 了 IP 电话 软件 和 相关 部 件 的 计算 机 ， 另 一 方 则 使 用 PSTN/ISDN/GSM 网 络 上 的 电话 。 在 
IP 网 络 的 边沿 需要 有 一 台 配 有 IP 电话 交换 功能 的 网 关 ， 用 来 控制 信息 的 传输 ， 并 且 把 IP 信 
息 包 转 换 成 电路 交换 网 络 上 传送 的 声音 ， 或 者 相反 。 


i 目 "4 
na 一 IP 网 络 “号 PsTN 


P 电 话 网 闫 一、 




















图 9.17 “IP 终端 与 电话 终端 之 间 的 通话 

电话 之 间 的 通话 方式 如 图 9.18 所 示 。 在 这 种 方式 中 ， 通 话 双 方 都 使 用 普通 电话 、 或 者 一 

方 使 用 可 视 电话 或 者 双方 都 使 用 可 视 电话 。 这 种 方式 主要 是 用 在 长 途 通信 中 ， 在 通话 双方 的 

IP 网 络 边沿 都 需要 配置 电话 功能 的 网 关 , 进行 耳 信息 包 和 声音 2 转换 及 控制 信息 的 传输 。 
~\ 

中 电话 网 关 NP 















































9.18 ”通过 IP 网 络 的 电话 之 间 的 通话 


3，IP 电话 标准 


开通 IP 电话 服务 需要 使 用 的 一 个 重要 标准 是 信号 传输 协议 (Signalling ProtocoD)。 信 号 传 
输 协议 是 用 来 建立 和 控制 多 媒体 会 话 或 者 呼叫 的 一 种 协议 ， 数 据 传输 (Data Transmission) 不 属 
于 信号 传输 协议 。 这 些 会 话 包括 多 媒体 会 议 、 电 话 、 远 距离 学 习 和 类 似 的 应 用 。JIP 信号 传输 
协议 (IP Signalling ProtocoD 用 来 创建 网 络 上 客户 的 软件 和 硬件 之 间 的 连接 。 多 媒体 会 话 的 呼叫 
建立 和 控制 的 主要 功能 包括 用 户 地 址 查找 、 地 址 转换 、 连 接 建 立 、 服 务 特性 磋商 、 呼 叫 终止 
和 呼叫 参与 者 的 管理 等 。 附 加 的 信号 传输 协议 包括 账单 管理 、 安 全 管理 、 目 录 服 务 等 。 

广泛 使 用 IP 电话 的 关键 问题 之 一 是 建立 国际 标准 ， 这 样 可 使 不 同 厂商 开发 和 生产 的 设备 
能 够 正确 地 在 一 起 工作 。 当 前 开发 PP 电话 标准 的 组 织 主要 有 ITU-T，IETF 和 欧洲 电信 标准 学 
会 (European Telecommunications Standards Institute，ETSD 等 。 人 们 认为 两 个 比较 值得 注意 的 可 
用 于 IP 电话 信号 传输 的 标准 是 ITU 的 H.323 系列 标准 和 IETF 的 入 会 协议 (Session Initiation 
Protocol，SIP)。SIP 是 由 IETF 的 MMUSIC(Multiparty Multimedia Session Control， 多 方 多 媒 
体会 话 控制 ) 工 作 组 正在 开发 的 协议 , 它 是 在 HTML 语言 基础 上 开发 的 , 并 且 比 H.323 简便 的 
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第 总. 
六 


下 多 媒体 找 坟 及 其 应 用 第 之 服 ) 





一 种 协议 ,该 协议 原来 是 为 在 mternet 上 召开 多 媒体 会 议 开发 的 协议 。H.323 和 SIP 这 两 种 协 
” 议 代 表 解 决 相同 问题 (多 媒体 会 议 的 信号 传输 和 控制 ) 的 两 种 不 同 的 解决 方法 。 此 外 , 还 有 两 个 
信号 传输 协议 被 考虑 为 SIP 结构 的 一 部 分 。 这 两 个 协议 是 会 话说 明 协 议 (Session Description 
Protocol，SDP) 和 会 话 通告 协议 (Session Announcement Protocol，SAP)。 国 际 多 媒体 远程 会 议 


协会 (Internation 
电话 协会 (MITI 





al Multimedia Teleconferencing Consortium, IMTC) 的 VoIP forum 和 MIT Internet 
nternet Telephony Consortium) 对 不 同 标准 和 网 络 之 间 的 协同 工作 比较 感 兴趣 。 





9.4” 流 媒体 技术 














流 媒体 技术 是 多 媒体 技术 和 网 络 传输 技术 的 结合 ， 是 宽带 网 络 应 用 发 展 的 产物 。 流 媒体 
技术 就 是 把 连续 的 影像 和 声音 信息 经 过 压缩 处 理 后 放 上 网 站 服务 器 ， 让 用 户 边 下 载 边 观看 、 
收听 ， 而 不 用 等 整个 压缩 文件 下 载 到 自己 的 计算 机 上 才 可 以 观看 的 网 络 传输 技术 。 该 技术 先 
在 使 用 者 端的 计算 机 上 创建 一 个 缓冲 区 ， 在 播放 前 预先 下 一段 数据 作为 缓冲 ， 在 网 络 实际 连 
线 速度 小 于 播放 所 耗 的 速度 时 ， 播 放 程序 就 会 取 用 一 小 段 缓冲 区 内 的 数据 ， 这 样 可 以 避免 播 




















放 的 中 断 ， 也 使 得 播放 品质 得 以 保证 。 
9.4.1 流 媒体 的 基本 概念 


WE 
也 都 希望 通过 互联 网 来 发 布 自己 的 音 视频 节 




















x 
队 
。 但 





是 ， 音 视频 在 存储 时 文件 的 体 职 一 般 都 十 


分 庞大 。 在 网 络 带 宽 还 很 有 限 的 情况 下 ， 花 几 十 分 钟 甚至 更 长 的 时 间 等 待 一 个 音 视频 文件 的 
0 现 ， 在 一 定 程度 上 使 互联 网 传输 音 视 


频 难 的 局 面 得 型 





改善 ,x 


传统 的 网 络 传输 宕 视频 等 多 媒体 信息 的 许 式 是 完全 下 载 后 再 播放 ， 下 载 党 党 要 花 数 分 名 


甚至 数 小 时 。 而 


ij 洒 用 流 媒体 技术 ， 就 可 实现 流 式 传输 ， 将 声音 、 影 像 或 动画 由 服务 器 向 用 户 


计算 机 进行 连续 、 不 间断 传送 ， 用 户 不 必 等 到 整个 文件 全 部 下 载 完毕 ， 而 只 需 经 过 几 秘 或 十 


几 秒 的 启动 延 时 





即 可 进行 观看 。 当 声音 视频 等 在 用 户 的 机 器 上 播放 时 ， 文 件 的 剩余 部 分 还 会 


从 服务 器 上 继续 下 载 。 





如 果 将 文件 


-传输 看 作 一 次 接 水 的 过 程 ， 过 去 的 传输 方式 就 像 是 对 用 户 做 了 一 个 规定 ， 必 


须 等 到 一 桶 水 接 满 才 能 使 用 它 ， 这 个 等 待 的 时 间 自 然 要 受到 水 流量 大 小 和 桶 的 大 小 的 影响 。 
而 流 式 传输 则 是 ， 打 开水 头 龙 ， 等 待 一 小 会 儿 ， 水 就 会 源源 不 断 地 流出 来 ， 而 且 可 以 随 接 随 
































， 因 此 ， 不 管 水 流量 的 大 小 ， 也 不 管 桶 的 大 小 ， 用 户 都 可 以 随时 用 上 水 。 从 这 个 意义 上 看 ， 
流 媒 体 这 个 词 是 非常 形象 的 。 

流 式 传输 技术 又 分 两 种 ， 一 种 是 顺序 流 式 传输 ， 另 一 种 是 实时 流 式 传输 。 
顺序 流 式 传输 是 顺序 下 载 ， 在 下 载 文件 的 同时 用 户 可 以 观看 ， 但 是 ， 用 户 的 观看 与 服务 














器 上 的 传输 并 不 是 同步 进行 的 ， 用 户 是 在 一 段 延 时 后 才能 看 到 服务 器 上 传 出 来 的 信息 ， 或 者 
说 用 户 看 到 的 总 是 服务 器 在 若干 时 间 以 前 传 出 来 的 信息 。 在 这 过 程 中 ， 用 户 只 能 观看 已 下 载 
的 那 部 分 ， 而 不 能 要 求 跳 到 还 未 下 载 的 部 分 。 顺 序 流 式 传输 比较 适合 高 质量 的 短片 段 ， 因 为 























它 可 以 较 好 地 保证 节目 播放 的 最 终 质量 。 它 适合 在 网 站 发 布 的 供用 户 点 播 的 音 视频 节目 。 




















在 实时 流 式 传输 中 ， 音 视频 信息 可 被 实时 观看 到 。 在 观看 过 程 中 用 户 可 快 进 或 后 退 以 观 

















看 前 面 或 后 面 的 内 容 ， 

















比较 差 。 


9.4.2 


流 媒体 技术 的 基本 原理 


db 
多 天 条 对 


但 是 在 这 种 传输 方式 中 ， 若 网 络 传输 状况 不 理想 ， 则 收 到 的 信号 效果 


流 式 传输 的 实现 需要 缓存 技术 、 高 效 的 传输 协议 和 合适 的 系统 架构 。 


1. 缓存 技术 





由 于 Internet 是 以 包 (Packeb) 传 输 为 基础 进行 的 断 续 异 步 传输 ,因而 对 一 个 实时 音 /视频 源 
或 存储 的 A/V 文件 ， 在 传输 中 它们 要 被 拆 分 成 若 了 





F 个 数据 包 。 由 于 网 络 是 动态 变化 的 ， 各 个 


数据 包 选 择 的 传输 路 由 可 能 不 尽 相 同 ， 所 以 到 达 客户 端的 时 间 延 迟 也 就 不 等 ， 甚 至 先 发 的 包 


还 有 可 
动 。 为 此 , 采 























新 利用 


2 传输 协议 





体 传输 要 能 在 各 种 网 络 结构 中 运行 
是 - -种 既成 事实 的 工业 标准 ， 流 媒体 传输 也 必须 采用 TCPA 协议 。 然 而 ，TCP/IP 协议 原本 


是 为 数据 传输 而 设计 ， 可 以 保证 乱 输 的 可 千 
而 流 媒体 传输 
此 ， 目 前 在 流 式 传输 的 实 





方案 中 ， 一 般 采用 


网 络 传输 协议 是 aa -系列 规则 、 


靠 性 ， 但 不 能 保证 
9 一 个 重要 特征 是 对 时 间 的 敏感 性 ， 前 此 才 须 确保 数据 的 实时 性 


能 后 到 ， 甚 至 还 有 未 到 的 情况 。 如 果 直 接 播放 这 种 数据 流 ， 会 引起 音 / 视 频 的 延迟 和 抖 
缓存 系统 来 解决 这 个 问题 。 还 要 保证 数据 包 的 顺 
ee 
容量 并 不 大 ， 因 为 高 速 缓存 使 用 环形 链表 结 nin 

EN 


、 完整 ， 从 而 使 媒体 
记 通常 高 速 缓存 所 需 的 
以 丢弃 已 经 播放 的 内 容 ， 重 





标准 或 约定 。 流 媒 


相应 的 网 络 传输 协议 。TCP/IP 网 络 通信 协议 


tL 





定时 间 内 到 达 目 的 地 。 
步 性 。 因 


RTP/UDP 





















P/TCP 来 传输 控制 信息 ， 而 





来 传输 实时 音 /视频 数据 = 此 外 ， 涉 及 流 媒体 症 输 认 4 协议 还 有 实时 传输 控制 协议 (RTCP)、 实 时 

































流 协议 (RTSP)、 资 预 留 协议 (RSVP) 等 。 图 .i9 说 明了 从 Web 菜单 中 点 播 流 媒体 节目 的 流 式 
传输 过 程 。 “ 
就 六 册 可 让 RTSP/TCP(UDP)| 
(播放 器 ) 
RTP/UDP 
图 9.19 ” 流 式 传输 过 程 
3. 实现 架构 


现 架 构 如 图 9.20 所 示 。 模 块 之 间 通 过 特定 的 协议 互相 通信 ， 


据 。 


的 媒体 流 ， 


一 个 最 基本 的 流 媒体 系统 必须 包括 编码 器 、 


流 媒体 服务 器 和 客户 端 播放 器 3 个 模块 ， 实 

















其 中 编码 器 














客户 端 播放 器 则 负责 





并 按照 特定 格式 互相 交换 文件 数 


来 将 原始 的 音 /视频 转换 成 合适 的 流 格式 文件 ， 服 务 器 向 客户 端 发 送 编码 后 
解码 和 播放 接收 到 的 媒体 数据 。 
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有 
- 记 









放 器 软件 来 播放 ， 所 谓 “ 一 把 钥匙 一 把 锁 ”。 目 前 必 采 用 流 媒体 技术 的 音 视 频 文人 


媒体 存储 设 备 





图 9.20 ” 流 媒体 系统 基本 结构 
在 运用 流 媒 体 技术 时 ， 音 视频 文件 要 采用 相应 的 属 式 ， 不 同 格式 的 文件 需要 用 不 同 的 播 
主要 有 3 大 





一 是 Microsoft 的 ASF(Advanced Strsam Format)。 这 类 文件 的 扩展 名 是 .asf 和 .wmv， 与 它 





对 应 的 播放 器 是 Microsoft 公司 的 “Media Player”。 用 户 可 以 将 图 形 、 声 音 和 动画 数据 组 合成 


-个 ASF 格式 的 文件 , 也 可 以 将 其 他 格式 的 视频 和 音频 转换 为 ASF 格式 , 而 且 用 户 还 可 以 通 


过 声卡 和 视频 捕获 卡 将 诸如 麦克 风 、 录 像 机 等 外 设 的 数据 保存 为 ASF 格式 。 


件 ， 
据 ， 
式 ， 


二 是 RealNetworks 公司 的 RealMedia， 它 包括 RealAudio、RealVideo 和 RealFlash 3 类 文 
其 中 RealAudio 用 来 传输 接近 CD 音质 的 音频 数据 ，RealVideo 用 来 传输 不 间断 的 视频 数 
RealFlash 则 是 RealNetworks 公司 与 Matromedia 公司 联合 推出 的 一 种 高 压缩 比 的 动画 格 
这 类 文件 的 扩展 名 是 .rm， 文 件 对 应 的 播放 器 是 “RealPlayer”。 

三 是 公司 的 QuickTime。 这 类 文件 扩展 名 通常 是 .mov, 它 所 对 应 的 播放 器 是 “QuickTime”。 
此 外 ，MPEG、AVI、DVI、SWF 等 都 是 适用 于 流 媒体 技术 的 文件 格式 。 

由 于 流 媒体 技术 在 一 定 程 度 上 突破 了 网 络 带宽 对 多 媒体 信息 传输 的 限制 ， 因 此 被 广泛 运 

















用 于 网 上 直播 、 网 络 广告 VOD、 远程 教育 、 远 程 医疗 、 视 频 会 议 、 企 业 培训 、 电 子 商 务 等 
多 种 领域 。 


向 。 
处 到 


9.5 小 结 


多 媒体 通信 体现 了 多 媒体 技术 与 通信 技术 的 结合 ， 是 当今 多 媒体 技术 发 展 的 一 个 主要 方 
多 媒体 对 通信 网 络 的 影响 主要 体现 在 网 络 带宽 、 实 时 性 、 同 步 性 、 交 互 性 及 分 布 式 信息 
等 方面 。 多 媒体 通信 不 仅 要 求 网 络 能 提供 足够 的 带宽 ， 以 保证 多 媒体 信息 的 高 效 传输 ， 


























而 且 


| 还 要 求 多 媒体 信息 传输 的 开销 尽 可 能 小 。 衡 量 多 媒体 通信 传输 质量 的 主要 指标 是 QoS。 








然而 ，QoS 中 的 有 关 参 数 本 身 是 相互 矛盾 的 ， 有 必要 综合 考虑 多 媒体 网 络 的 特性 、 权 衡 参数 ， 
以 设计 出 满足 一 定 需要 的 多 媒体 通信 应 用 系统 ， 适 应 一 定 的 网 络 传输 环境 。 多 媒体 通信 网 络 
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一 
大 致 可 分 为 3 类 : 基于 电信 网 的 多 媒体 信息 传输 、 基 于 计算 机 网 的 多 媒体 信息 传输 和 基于 有 
线 电 视 网 的 多 媒体 信息 传输 。 在 目前 种 类 繁多 的 多 媒体 通信 系统 中 ， 具 有 代表 性 的 有 可 视 电 
话 、 电 视 会 议 系统 、VOD 系统 、IP 电话 等 。 多 媒体 通信 将 是 “信息 高 速 公路 ”的 主体 通信 业 
务 ， 也 是 未 来 通信 发 展 的 方向 。 




















9.6 习 题 
1. 填空 题 
(1) 多 媒体 通信 (Multimedia Communications) 是 与 的 完美 结合 。 
(2) 中 文 名 称 是 综合 业务 数字 网 ， 通 俗称 为 “一 线 通 ”。 
(3) 根据 系统 响应 时 间 长 短 ，VOD 系统 可 分 为 和 __ ~ 两 类 。 
(4) 目前 ， 流 行 的 有 两 大 VOD 网 络 系统 ， 即 和 - 
(5) 为 解决 不 同 厂家 产品 的 兼容 性 问题 ， Dn 。 该 标准 现 


在 已 被 国际 电信 联盟 采纳 并 作为 世界 可 视 电话 标准 。 < 
(6) H.323 是 一 个 在 局 域 网 上 并 且 不 保证 QoS am 是 的 改进 版 本 。 


2 选择 题 
(1) wwmanirang 决定 了 系统 是 多 媒体 通信 系统 还 是 多 种 媒体 


通信 系统 。 
A， 通 信 数 据 量 巨大 ni C0 同步 性 D. 交互 性 
Co) 在 下 列 有 关 下 OverA3M 的 仙 太 中 ， 不 正确 的 是 
A. 具有 良好 的 流量 控制 均衡 能 力 及 故 A 网 络 可 靠 性 高 
B. 适应 于 多 生 务 ， 具 有 良好 的 网 络 可 扩 
6. Xin Te se” 
D. 不 能 像 P over SDH 技术 那样 提供 较 好 的 QoS 保障 
(3) H.324 系列 是 一 个 低位 速率 多 媒体 通信 终端 标准 ， 在 它 的 旗号 下 的 标准 包括 
A. H.320 B. H.323 Cc. SP D. H.263 
(4) 在 下 列 有 关 MPLS 的 叙述 中 ， 正 确 的 是 __ 
A. 是 一 种 面向 连接 的 传输 技术 
B. MPLS 不 但 支持 多 种 网 络 层 技术 ， 而 且 是 一 种 与 链 路 层 相关 的 技术 
C. 采用 了 ATM 信 令 的 高 效 传输 方式 
D. 不 能 够 提供 有 效 的 QoS 保证 
(5) 是 H.323 中 最 重要 的 部 件 ， 是 它 管辖 区 域 里 的 所 有 呼叫 的 中 心 控制 点 ， 并 且 为 注 
册 的 端点 提供 呼叫 控制 服务 。 
A. 终端 B. 网 关 C. 会 务 器 D. MCU 
(6) 在 下 列 有 关 ATM 的 叙述 中 ， 不 正确 的 是 __ 
A. 兼 有 分 组 交换 和 电路 交换 的 双重 优点 
B， 以 固定 长 度 的 信 元 (celD) 发 送信 息 ， 能 适应 任何 速率 
C. 采用 误 码 控制 和 流量 控制 ， 大 大 降低 了 延 时 
D. 非常 适合 多 媒体 通信 
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9 章 人 
- 辣 


人 区 这 条 牧 及 让 其 训 用 (第 2 县 ) 














一 (0) 下 面 关于 VOD 系统 的 叙述 ， 不 正确 的 是 _ 


A. NVOD 要 求 有 严格 的 即时 响应 时 间 ，TVOD 对 系统 响应 时 间 有 一 定 的 宽 限 
B. VOD 系统 的 网 络 环境 可 以 是 LAN 也 可 以 是 WAN 
C. VOD 系统 是 一 种 基于 C/S 模型 的 点 对 点 实时 应 用 系统 
D. VOD 系统 信息 交互 具有 不 对 称 性 
(8) IP 电话 允许 在 使 用 __ 协议 的 Internet、 内 联网 或 者 专用 LAN 和 WAN 上 进行 电话 
交谈 。 























A. TCP/IP B. HTTP C. FTP D. Telnet 

3， 判断 题 
(1) ATM 不 仅 可 用 于 通常 的 数据 通信 以 传送 正文 和 图 形 ， 还 可 以 用 于 传送 声音 、 动 画 和 
活动 图 像 ， 能 满足 实时 通信 的 需要 。 € 杞 
(2) MPLS 在 提供 IP 业务 时 不 能 确保 QoS。 从 人 六 








G) Intemet 上 的 电视 会 议 ， 目 前 大 部 分 都 趋向 于 采用 mn 标准 。 
< ( ) 

(0) H.323 是 一 个 应 用 在 局 域 网 上 ， 并 且 保证 Q6t Oh ane, ( ) 
(5) IP 电话 是 在 人 P eT 叫 和 通话 ， 而 不 是 在 传统 的 公众 交 

换 电话 网 络 上 进行 的 呼叫 和 通话 。 ( ) 

4.， 简 答题 、X 

(CD 多 媒体 通信 与 i 六 > 

(2) 多 媒体 通信 需要 解决 哪些 关键 技术 ? L 

G) 传统 的 通信 网 络 可 以 分 为 哪些 类 型 

(4) 0 、FDDI、Ethernet、 ATM 和 OD 为 例 ， 概 述 多 媒体 信息 传输 的 特点 

(5) 什么 es 5? 什么 是 电视 会 说 ? : 作 么 是 人 P 电话 ? 试 简 述 它们 的 相关 标准 的 具体 


(6) 多 媒体 通信 的 标准 有 哪些 ? 











内 容 。 


第 10 草 多 媒体 技术 实验 


教学 提示 

a 
本 章 结合 前 面 章节 的 学 妈 ; 提供 5 个 实验 案例 进行 知识 的 加 强 , 同时 
提高 学 生 的 动手 能 如 

> ”本 实验 主要 履 盖 音频 操作 、Photoshop 图 片 处 理 、Flash 制作 、HTML 
网 页 制作 及 Winidows Movie Maker 等 几 个 方面 。 





教学 目标 

CE 

六 “本 章 围绕 前 面 几 章 的 内 容 ,， ,进一步 提高 动手 操作 能 力 ， 加 深 对 多 媒 
体 知 识 的 学 习 与 理解 。 


下 多 媒体 找 术 及 其 应 用 (第 2 版 ) 


10.1 声音 的 编辑 与 处 理 


通过 Cool Edit 软件 的 操作 ， 学 习 掌握 声音 的 基本 编辑 与 处 理 操作 。 
10.1.1 “实验 要 求 

(1) 掌握 Cool Edit 软件 运行 方式 和 声音 编辑 与 处 理 的 常用 技术 。 

(2) 了 解 和 熟悉 Cool Edit 基本 工具 和 使 用 方法 。 

(3) 掌握 对 数字 声音 编辑 的 常用 技术 。 

(4) 使 用 Cool Edit 相关 命令 ， 对 声音 进行 合成 、 淡 入 /淡出 、 加 入 回音 效果 等 。 




















10.1.2 ”实验 内 容 


利用 Cool Edit 对 语音 文件 chunxiao.mp3 进行 编辑 。 要 求 如 下 。 
(1) 去 掉 开头 的 空白 区 域 。 "an 

(2) 删除 25s 开始 的 重复 片段 。 
(3) 追加 huanghelou.mp3 到 末尾 。 




















10.1.3 ”实验 步骤 


(1) 运行 Cool Edit 2.0 软件 ， 打 开 语音 文件 chunxiaouip3， 如 图 10.1 所 示 。 


中 四 四 ES rmmrn py 
局 辐 胃 多 吕 电导 局 司 coco oo0 





图 10.1 Cool Edit 打开 语音 文件 chunxiao.mp3 


(2) 单 击 “Play” 按 钮 有 播放 声音 。 

(3) 去 掉 开始 约 2s 左右 的 空白 。 

名 选中 空白 波形 部 分 ， 被 选中 的 部 分 以 反 色 显示 ， 如 图 10.2 所 示 。 
加 按 Delete 键 删 除 选中 区 域 。 

@ 将 光标 移 到 24s 的 位 置 ， 选 择 至 末尾 。 

@ 按 Delete 键 删除 选择 区 域 ， 结 果 如 图 10.3 所 示 。 

加 单 击 “Play” 按 钮 播放 声音 ， 查 看 是 否 正确 。 
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ed enc Ne Lanale salililnlel 


局 画面 


a 下 HH 让 - 一 寺 协作 je 


a 


[Te 
Mmmm eevee 027.863 





四 


图 10.2 选中 空白 波形 部 分 





Se ees Fev es Writ be Pp 


CEEEDIEEEEECEEEEDIEECEEGISEEETEER 


EL 大 时 nt Wi 


[ell lm 
四 四 DC 网 园丁 Fe 





图 10.3 “删除 重复 后 的 波形 
(4) 将 声音 文件 huanghelou.mp3 合并 到 chunxiao.mp3 文件 的 后 面 , 使 之 成 为 一 个 声音 文件 。 
Q@ 打开 huahghelou.mp3 文件 。 
@@ 按 Ctrl+A 组 合 键 选择 全 部 波形 ,“Edit” 一 “Copy” 选 项 ， 将 选中 部 分 复制 到 剪贴 板 。 
人 @@) 单 击 文件 面板 中 的 chunxiao.mp3， 将 光标 移 到 波形 图 的 最 后 ， 选 择 “Edit” 一 “Paste” 
选项 ， 便 将 声音 文件 huanghelou.mp3 并 到 chunxiao.mp3 文件 的 后 面 ， 如 图 10.4 所 示 。 





四 四 四 号 四 本 丁酉 
本 四 下 回国 四 本 

















图 10.4 文件 huang he lou.mp3 并 到 chunxiao.mp3 文件 后 
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ho 


ee 


下 | 多 媒体 技术 及 其 应 用 (第 之 版 ) 
(5) 删除 合并 后 文件 中 的 介绍 黄 稚 楼 的 部 分 。 
@ 选择 位 于 1s 的 位 置 ， 直 至 末尾 ， 如 图 10.5 所 示 。 

















rr mri 


Lalla ell 1.03.185 
Em Eveyey FY re 


al M7 MO 


图 10.5 删除 部 分 声音 


@ 选择 “Edit” 一 “Cut” 选 项 (或 按 CtrlHX A 出 除 所 过 内 容 。 

@ 单 击 “Play” 按 钮 试听 编辑 效果 。 A 

(6) 保存 文件 。 wx 

选择 “File” 一 “Save As” 选 项 ， 打开 “ve Waveform As” 对 话 框 ， 在 “文件 名 ”文本 
框 中 输入 文件 名 ， 并 单 击 “ 保 存 ” . AN 厂 


10.1.4 ”思考 与 实践 SS 


(1) 利用 Cool Edit 录制 自己 ;朗诵 的 《春晓 》 诗 
对 所 录制 的 诗词 可 以 进行 以 下 修饰 操作 。 ，。、、 

@ 进行 淡 入 /淡出 处 理 ， 加 入 回声 效果 

© 为 编辑 的 声音 配 背景 音乐 。 各 

@ 进行 变速 、 变 调处 理 。 

(2) 将 正在 编辑 的 文件 转化 为 MP3 格式 ， 并 存盘 保存 。 











人 着 与 chunxiao.mp3 合成 在 一 起 。 此 外 


10.2 ”数码 照片 的 处 理 (一 ) 


通过 Photoshop 软件 的 操作 ， 掌 握 数码 照片 处 理 的 基本 操作 。 
10.2.1 ”实验 要 求 


(1) 掌握 Photoshop 运行 方式 和 数码 照片 常用 处 理 技术 。 
(2) 了 解 和 熟悉 Photoshop 基本 工具 的 作用 和 使 用 方法 。 
(3) 掌握 对 数码 相片 中 人 脸 的 修饰 和 美化 方法 。 

(4) 熟练 使 用 套 索 工具 、 羽 化 工具 和 仿制 图 章 工具 。 



































10.2.2 ”实验 内 容 
利用 Photoshop 导入 一 幅 人 物 数码 相片 face.jjpg， 对 人 脸 进行 修饰 。 要求: 在 尽 可 能 多 地 
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| 第 10 章 .有 
| a 
保持 皮肤 原来 的 肤色 和 光泽 同时 ， 消 除 皮肤 上 的 疤痕 或 黑 痣 等 瑕 症 ， 并 且 消 除 黑 眼袋 。 编 辑 
前 后 的 效果 如 图 10.6 所 示 。 

















一 
(b) 编辑 后 





图 10.6 ”人物 图 片 编辑 


10.2.3 ”实验 步 又 AL 
(1) 运行 Photoshop CS5 软件 ， 导 入 一 张 人 物 数码 相片 。 
@ 运行 Photoshop CS5 软件 。 选 择 “ 开 始 … 一 “所 有 程序 ”一 “Adobe Photoshop CS5” 
@ 选择 “文件 ”一 “打开 ”选项 、 选择 需要 处 理 的 数码 相片 ， 如 facejpg 打开 如 图 10.7 
所 示 的 运行 界面 。 1 4 
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图 10.7 打开 face.jpg 文件 
(2) 消除 脸 部 斑点 
@ 选择 工具 箱 中 的 “ 套 索 ”工具 ， 在 要 删除 的 斑点 附近 找 一 个 没有 瑕 疲 的 皮肤 区 域 。 在 
附近 选取 区 域 是 为 了 使 修复 后 的 肤色 看 起 来 均匀 一 致 。 在 本 例 中 需要 删除 眼睛 下 方 的 一 颗 黑 
赎 。 注 意 选区 应 该 比 痣 稍 大 一 些 ， 以 遮挡 整个 黑 痣 ， 如 图 10.8 所 示 。 
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图 10.8 es 
SNX 

@ 标 出 选区 后 ， 选 择 “选择 ”一 “修改 = ”选项 ， 打 开 “ 羽 化 选区 ”对 话 框 ， 
如 图 10.9 所 未 羽 化 半径 设置 为 1 像素 ， 然 后 单 击 “ 确 定 ” 按 
钮 。 羽化 J 是 模糊 选区 的 边缘 ， 这 有 助 于 掩饰 对 皮肤 修饰 
的 痕迹 Pee 
= “7 名 现在 选区 边 乡 已 经 变 得 条 和 ， 按 AlttCtrl 组 合 键 ， 忌 标 
图 109 羽化 渤 区 对 活 要 ”指针 变 成 双 箭 头 ， 按 名 的 同时 ， 在 选区 内 单 击 ， 并 把 整个 选区 

一 拖 放 到 症 上 ， 以 完全 名 它 。 此 时 选区 已 经 被 复制 到 痣 上 面 ， 
如 图 10.10 所 示 。， < 从 * 人 Sy 
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图 10.10 ”复制 正常 皮肤 到 黑 疙 区 域 
@ 松 开 按 键 和 鼠标 ， 选 择 “选择 ”一 “取消 选择 ”选项 ， 或 者 直接 按 Ctrl+D 组 合 键 ， 

















取消 选区 。 至 此 , 消除 黑 痣 已 经 完成 , 同样 的 方法 可 消除 面部 其 他 斑点 , 完成 后 效果 如 图 10.11 
所 示 。 
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图 10.11 ` 消 
(3) 消除 黑 眼袋 。 \K RR 

O 区 在 选项 栏 上 设 定 画 笔 的 大 小 ， 一 般 说 来 ， 面 笔 
的 宽度 应 该 等 于 要 修复 区 域 的 十 六 或 栈 多 。 XX 

@ 选项 栏 上 的 “不 透明 度 忆 设置 为 50%， 并 把 :各 式 * 设置 为 “ 变 亮 ” 其 目的 是 使 所 
做 的 操作 只 影响 比 采样 点 更 瞳 的 区 域 。 ,XX 

@@ 按 住 At 键 过 在 右 眼 附近 无 眼袋 的 区 域 单 击 ” 将 这 个 区 域 作为 采样 区 。 本 例 中 由 于 光 
ne 所 以 需要 对 震 帮 眼 分 别 采样 ， 在 光照 均匀 的 情况 下 ， 可 以 采样 

有 
4 





























一 次 消除 一 双 如 图 10.12 所 示 。 
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10.12 ”消除 眼袋 
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@ 选择 “仿制 图 章 ”工具 ， 拖 动 鼠标 指针 在 黑 眼袋 的 部 位 绘制 ， 
以 减轻 或 清除 眼袋 。 一 般 需要 多 描 几 笔 ， 直 至 彻底 消除 黑 眼袋 。 
图 对 左 眼 重复 图 、@ 田 步 。 双 眼 眼 袋 消除 后 的 效果 如 图 10.13 所 














(4) 保存 文件 。 
选择 “文件 ”一 “存储 为 ” 选项， 打开“ 存储 为 ” 对话 框 ， 在 “ 文 
图 10.13 最 终 处 理 结果 件 名 ”文本 框 中 输入 文件 名 ， 并 单 击 “ 确 定 ” 按 钮 。 


10.2.4 ”思考 与 实践 


(1) 找 一 幅 有 皱纹 的 老人 照片 ， 利 用 Photoshop 消除 其 皱纹 。 

(2) 如 何 对 眼睛 进行 修饰 ,消除 眼睛 中 的 血丝 ?能 否 改 变 照片 中 人 的 皮肤 颜色 , 使 皮肤 更 
白 些 。 

We dogjpg 进行 修改 ， 去 掉 
照片 背景 中 多 余 的 部 分 ( 狗 )， 处 理 后 的 图 片 如 图 10.14(b) 所 示 
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(项 理 前 的 图 片 交 Vv (b) 处 理 后 的 图 片 
“~ 下 永 


SN 全 图 10.14 dd bg 处 理 前 后 对 比 
要 求 进行 如 下 操作 。 
名 在 Photoshop 中 打开 要 处 理 的 图 片 。 
@ 选择 工具 箱 中 的 “仿制 图 章 ” 工 具 。 
@ 按 住 Alt 键 ， 在 要 去 掉 的 多 余 背景 附近 区 域 单 击 ， 将 这 个 区 域 作为 采样 区 。 
@ 选择 “仿制 图 章 ” 工 具 ， 拖 动 鼠标 指针 在 要 去 掉 的 多 余 背景 区 域 中 绘制 ， 系 统 便 可 所 
所 采样 的 背景 色 代 蔡 绘制 区 域 的 内 容 。 


提示 : 为 了 让 去 掉 的 区 域 背景 更 自然 ， 可 重复 步骤 国 、@@ 直 到 完全 去 掉 多 余 的 部 分 为 止 。 
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10.3 ”数码 照片 的 处 理 ( 二 ) 


10.3.1 ”实验 要 求 


(1) 了 解 和 熟悉 Photoshop 基本 工具 的 作用 和 使 用 方法 。 
(2) 掌握 对 数码 相片 中 背景 的 修饰 及 对 光线 的 调节 。 
(3) 掌握 裁剪 工具 、 文 字 工 具 和 图 层 样式 的 使 用 。 


EE 


























ee 
10.3.2 ”实验 内 容 


利用 Photoshop 导入 一 幅 需 要 调整 光照 及 背景 的 相片 。 本 例 中 , 使 用 一 幅 建 筑 照 ， 整 幅 
片 的 色调 比较 暗 ， 天 空 显得 灰 蒙蒙 的 ， 需 要 进行 处 理 。 另 外 想 突 出 建筑 这 一 主题 ， 所 以 处 理 
之 前 还 要 进行 适当 的 裁剪 。 添 加 彩色 文字 作为 标题 。 


10.3.3 ”实验 步骤 


(1) 运行 Photoshop CS5 软件 ， 导 入 图 片 。 

@ 选择 “开始 ”一 “所 有 程序 ”一 “Adobe Photoshop CS5” 选 项 。 

加 选择 “文件 ”一 “打开 ”选项 , 选择 需要 处 理 的 数码 相片 ,如 shipjpg。 图 片 如 图 10.15 所 示 。 

(2) 裁剪 图 片 。 

若 想 尽 量 凸 显 房子 这 一 主题 ， 在 对 图 像 进行 处 理 前 ， 需要 先进 行 裁 交 。 

@ 选择 Photoshop 工具 箱 中 的 “裁剪 ”工具 ， 把 鼠标 指针 移 到 图 片 左上 角 合 + 适 的 位 置 。 
向 右 下 方 拖 电 鼠 标 指 针 ， 图 片上 出 现 一 个 虚线 矩形 框 ， 如 图 “i0.16 所 示 ， 松 开 鼠 标 ， 人 矩形 框 
外 的 区 域 变 暗 ， 变 暗 区 域 为 需 剪 去 的 部 分 。 如 果 消 守 刘 新 选择 的 区 域 ， 按 Esc 键 即 可 。 
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只 33% ls 
图 10.15 打开 shipjpg 图 片 10.16 使 用 “裁剪 ”工具 
四 按 Enter 键 进行 裁剪 ， 得 到 需要 进行 处 理 的 图 片 ， 如 图 10.17 所 示 。 
pps © 50°% (N02.05) - » EE 
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图 10.17 需要 进行 处 理 的 图 片 
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10 章 有 


后 亮 


多 媒体 技术 及 其 应 用 (第 2 版 ) 
@ 加 亮 图 片 。 
由 于 本 图 显得 灰暗 ， 所 以 需要 进行 加 亮 处理 。 
@ 选择 “图 像 ” 一 “调整 ”一 “自动 色 阶 ” 选 项 ， 亮 度 即 进行 自动 调整 。 可 以 发 现 调 整 
度 变 亮 了 。 
@@ 对 于 专业 摄影 人 士 来 说 ， 更 多 时 候 需 要 手动 调整 亮度 ， 这 时 可 以 选择 “图 像 ” 一 “ 调 
一 “ 色 阶 ” 选 项 ， 打 开 “ 色 阶 ” 对 话 框 ， 拖 动 色 阶 图 下 方 中 间 的 三 角 ， 手 动 调 整 亮度 ， 
单 击 “ 确 定 ” 按 钮 ， 如 图 10.18 所 示 。 本 实验 中 使 用 手动 方法 。 调 整 后 的 图 像 如 图 10.19 
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SAN 
图 10.18 “ 色 阶 ”对 话 框 、 NS 六 调整 后 的 图 像 
(4) 添加 “船形 建筑 ” x 


选择 “ 横 排 文字 ”工具 在 图 片 ， As 其 参数 参照 图 10.20。 
插入 文字 后 的 图 片 效果 如 图 10.21 所 示 半 - YY 
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刨 0 FF IE 

Tr IhTT T* 

ERE mu Sr Rn |: 册 
图 10.20 “字符 ” 调 板 图 10.21 插入 文字 后 的 图 片 











(5) 调整 文字 效果 。 
@ 在 “船形 建筑 ”文字 图 层 上 ， 单 击 高 -按钮 ， 在 弹出 的 下 拉 菜 单 中 ， 选 择 “ 投 影 ” 选 
如 图 10.22 所 示 ， 打 开 “ 图 层 样式 ”对 话 框 ， 选 择 “ 投 影 ” 样 式 ， 角 度 设置 为 120°。 





























Ed LL. 
和 | - 


@ 选择 “渐变 琶 加 ”样式 ,渐变 设置 为 “光谱 ”， 样 式 设置 为 “线性 ”， 角 度 设 置 为 “0”， 
如 图 10.23 所 示 ， 修 改 完毕 后 单 击 # 















































图 10.22 下 拉 菜 单 & A 图 10.23 “图 层 样式 "对话 杠 
@ 效果 如 图 10.24 所 示 。 完成 了 保存 文件 。 x 





驴 同 FT] Fs » 
图 10.24 ”完成 后 的 效果 


(6) 保存 文件 。 
选择 “文件 ”一 “存储 为 ”选项 ， 打 开 “ 存 储 为 ”对 话 框 ， 输 入 文件 名 并 选择 保存 类 型 ， 
然后 单 击 “ 确 定 ”按钮 。 


10.3.4 ”思考 与 实践 


(1) 利用 Photoshop 将 文件 snow.jpg 进行 修饰 ， 要 求 对 图 像 进 行 裁剪 ,然后 调整 图 像 的 色 
彩 、 亮 度 ， 改 变 天 空 与 水 的 颜色 。 调 整 前 的 照片 如 图 10.25 所 示 。 
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图 10.25 调 吾 前 的 照片 AAA 


(2) 利用 Photoshop 将 seagulljpg( 图 10. 60 的 和 了 引 张 照片 beach.jpg( 图 10.26(b)) 
的 背景 上 ， 结 果 如 图 10.27 所 示 。 






< 
mm 长 2 纪 
AN < 
Neenllipe 12 (b) beach.jpg 


10.26 图 片 





图 10.27 ”完成 后 的 效果 图 
(3) 利用 Photoshop 将 图 10.28 所 示 的 文件 dog2.jpg 进行 修饰 , 要 求 是 用 图 10.29 所 示 的 


















































lawn.jpg 作为 背景 。 


Bo 





图 10.28 dog2.jpg 图 10.29 lawnJjpg 


10.4 ”Flash 动画 WA 从 


通过 Flash 软件 的 操作 ， 掌 握 Flash 动画 PR 














































































































10.4.1 ”实验 要 求 i NN 

(1) 熟悉 Flash 的 运行 方 rt 作 钼 面 的 构成 。 

(2) 掌握 动画 制作 的 基本 原理 (组 件 ) 的 制作 。 ”一 ， 

(3) 掌握 简单 动画 的 制作 ys E 

(4) 掌握 形状 补 癌 动 画 的 制作 方法 。 XLGL 

(5) 担 动作 品 的 和 与 播 放 广 法 Ng 从 
10.4.2 eg < > 

(1) 利用 ElisiCss 创建 一 个 简单 的 形状 补 间 动 画 ， 显 示 一 个 圆 变 为 矩形 的 过 程 。 

(2) 利用 Flash CS5 创建 一 个 文字 连续 变形 动画 ， 实 现 字符 从 F 一 L 一 A 一 S 一 H 的 变形 
动画 。 
10.4.3 ”实验 步骤 

(1) 利用 Flash CS5 创建 一 个 简单 动画 ， 显 示 一 个 圆 变 为 矩形 的 过 程 。 

操作 步骤 如 下 。 

@ 运行 Flash CS5。 选 择 “ 开 始 ” 一 “所 有 程序 ”一 “Adobe Flash Professional CS5” 选 
项 ， 打 开 其 运行 界 

加 在 时 闻 轴 的 第 1 帧 处 ， 选 择 工 具 栏 中 的 椭圆 工具 ， 并 在 填充 色 中 选择 绿色 渐变 色 ， 按 
Shift 键 并 拖 动 鼠标 在 场景 1 的 舞台 中 央 画 出 一 个 圆 ， 显 示 界 面 如 图 10.30 A 

@ 在 第 30 帧 处 ， 右 击 ， 在 弹出 的 快捷 菜单 中 选择 “插入 空白 关键 帧 ” 选 

图 选择 工具 栏 中 的 多 角 星 形 工 具 ， 单 击 “ 属 性 ”面板 中 的 工具 设置 中 的 i 按钮 ， 
打开 “工具 设置 ”对 话 框 ， 在 “样式 ”下 拉 列 表 中 选择 “ 星 形 ” 选 项 ， 单 击 “确定 ” 按 钮 关闭 
对 话 框 .在 填充 色 中 选择 红色 渐变 色 , 在 场景 1 的 舞台 中 央 画 出 一 个 多 角 星 形 (如 图 10.31 所 示 )。 

加 单 击 第 1 帧 处 ， 选 择 “ 插 入 ”一 “ 补 间 形状 ”选项 (如 图 10.32 所 示 )， 创 建 变形 动画 。 
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区 巡 订 技术 发 其 应 用 (第 之 腑 ) 
匡 rw 一 CS 
| i i ED WD td to Mi i 












Er FE 


图 10.31> 多 角 星 形 
nn | 











图 10.32 插入 “ 补 间 形 状 ” 动画 





@@ 按 Enter 键 ， 看 动画 效果 。 

@ 选择 “文件 ”一 “保存 ”选项 ， 打 开 “ 另 存 为 ”对 话 框 ， 在 “文件 名 ”文本 框 中 输入 
“animitorl "”， 单 击 “ 保 存 ” 按 钮 。 

(2) 利用 Flash CS5 创建 一 个 文字 连续 变形 动画 ， 实 现 字 符 从 F 一 L 一 A 一 S 一 H 的 变形 动 
画 ， 操 作 步 又 如 下 。 

名 运行 Flash CS5， 单 击 “ 属 性 ”面板 中 的 “编辑 ”按钮 ， 如 图 10.33 所 示 ， 打 开 “ 文 档 
属性 ”对 话 框 ， 设 定 动画 的 大 小 为 60 像素 X100 像素 ， 单 击 “ 确 定 ” 按 钮 。 


区 [SIC 
Ed 本币 司 天 下 必 ， 剖 5 训 
















































一 Ea i 
2 所 -图 1033 文风 性 中 的 “六 和 按钮 


击 时 间 儿 的 第 -1 帧 ， 选 择 工具 箱 中 的 文本 工具 。 
E te Arial 字体 ， 关 小 为 2， 颜色 为 黑色 。 在 舞台 输入 字母 “F”。 
工具 


Q@ 单 
@ 在 
@ 选择 工具 栏 中 的 选择 工具 ， 选 中 字母 “F ”， 然 后 选择 “修改 ”一 “分 离 ”选项 。 
回 右 击 时 间 轴 第 10 帧 处 ， 在 弹出 的 快捷 菜单 中 选择 “插入 空白 关键 帧 ”选项 。 
@ 单 击 “ 时 间 轴 ”面板 下 方 的 “绘图 纸 外 观 ” 按 钮 ， 便 显示 灰色 的 “F” 字 母 。 
@ 选择 工具 箱 中 的 文本 工具 ， 继 续 输入 “L ”， 覆 盖 在 字母 “F” 上 ， 然 后 选择 “修改 ”一 
“分 离 ” 选 项 。 
以 同样 方法 分 别 在 第 20、30、40 帧 处 输入 字母 “A”“S”“H”， 并 选择 “修改 ”一 
“分 离 ” 选 项 ， 打 散 这 些 字母 。 
图 在 “时 间 轴 ”面板 中 的 第 1 帧 处 ， 右 击 ， 在 弹出 的 快捷 菜单 中 选择 “创建 补 间 形 状 ” 
以 同样 方法 ， 分 别 右 击 “ 时 间 轴 ”面板 中 第 10、20、30 帧 处 ， 在 弹出 的 快捷 菜单 中 
选择 “创建 补 间 形 状 ” 选 项 ， 如 图 10.34 所 示 。 
四 按 Enter 键 ， 看 动画 效果 。 
加 选择 “文件 ”一 “保存 ”选项 ， 打 开 “ 另 存 为 ”对 话 框 ， 在 “文件 名 ”文本 框 中 输入 
animitor2， 单 击 “ 保 存 ” 按 钮 。 
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图 10.34 创建 补 间 形 状 





人 
(1) Flash 包括 哪些 动画 形式 ? cnmn 


(2) 什么 是 关键 帧 ? 其 用 途 是 什么 ? - RK 
作 


10.4.4 ”思考 与 实践 


(3) 利用 补 间 形 状 动画 的 制作 方法 汽车 变 房子 的 Flash 动画 。 


10.5.1 ”实验 要 求 a Sr 
(D 掌握 创 下 网 页 的 过 各 # 沦 
(2) 学 习 格 的 应 用 。 

(3) 学 习 插 入 一 个 图 片 。 
(4) 学 习 使 用 列表 。 


10.5.2 ”实验 内 容 
制作 一 份 简单 的 个 人 简历 。 
10.5.3 ”实验 步骤 


(1) 启动 Adobe Dreamweaver CS5。 选 择 “ 开 始 ” 一 “所 有 程序 ”一 “Adobe Dreamweaver 
CS5” 选 项 ， 打 开 其 运行 界面 。 

(2) 新 建 一 个 HTML 空白 页 面 。 在 图 10.35 所 示 的 页 面 中 ， 内 容 为 空白 页 面 ， 但 该 页 面 
的 DOCTYPE 为 xhtml， 为 了 兼容 新 的 设备 ， 将 其 改 为 HTMLS 标准 的 ， 修 改 后 的 代码 如 下 。 








菜单 栏 


WE /HATE 
LH/ me tid 
Le 


二 or winrr 
代码 窗口 一 rom 





属性" 面 梳 > we 
图 10.35 新 建 H 页 面 


SN 
G) 简历 "。 书本 们 本 此 时 “属性 ”面板 显示 为 
“HTML”, 曾 属 性 ”按钮 ， 打 开 mi 对 话 框 ， 如 图 10.36 所 示 。 在 “分 类 ” 


RE 题 /编码 ”选项 ， 右 侧 的 详细 面板 中 会 显示 “标题 ” 将 “无 标题 文档 ” 改 
为 “我 的 简历 ” 单 击 “ 确 定 ” 按 钮 。 





村 是 中 ， 所 5 于 历 
i | 


pm rr 硬 开 可 
Wienke 和 


Bs Vnicede 签名 E00) G) 




















10.36 “页 面 属性 ”对 话 框 


Ee 和 巡 体 技术 发 其 应 用 (第 之 腑 ) 
-一 ”知识 链接 


什么 是 文档 类 型 (DOCTYPE) 

DOCTYPE 是 document type 的 缩写 ， 该 声明 位 于 文档 中 的 最 前 面 ， 即 在 HTML 标记 
前 。 该 标记 用 于 告知 浏览 器 该 页 面 选用 了 哪 种 HTML 或 者 XHTML 规范 。 一 个 完整 规范 
的 页 面 ， 必 须 包括 该 标记 ， 否 则 浏览 器 不 知 用 何 种 规范 来 解析 泻 染 该 页 面 。 对 于 访问 者 来 
说 ， 不 同 的 浏览 器 可 能 会 呈现 不 同 的 展现 效果 。 目 前 常用 的 文档 类 型 有 HTML 4.01 
Transitional、HTML 4.01 Strict、XHTML 1.0 Transitional、XHTML 1.0 Strict、XHTML 1.1、 
HTML 5。 

最 新 的 文档 类 型 为 HTML 5， 也 是 主导 发 展 趋势 ， 为 了 兼容 移动 设备 ， 人 们 一 般 采 用 
HTML 5。 但 是 目前 旧版 本 的 浏览 器 ， 如 Internet Explorer 8.0 及 更 早 的 版 本 不 支持 该 类 型 





但 是 还 是 能 够 呈现 。 

(4) 总 体 页 面 布 局 选用 表格 布局 方式 。 选 择 “ 插 入 ”一 es 打开 如 图 10.37 所 
示 的 “表格 ”对 话 框 ， 设 置 行 数 为 5S， 列 数 为 2， 表格 宽 Se 100%， 边 框 粗细 为 0 像素 ， 单 
元 格 边 距 为 6， 单 元 格 间距 为 0。 设置 完成 后 单 击 p 钮 插入 一 个 表格 。 


























Ce [A 





图 10.37 “表格 ”对 话 框 


(5) 插入 个 人 照片 。 定 位 在 第 一 行 第 一 列 单元 格 ， 选 择 “ 插 入 ”一 “图 像 ”选项 ， 然 后 选 
择 自己 的 照片 文件 ， 单 击 “ 确 定 ”按钮 ， 打 开 “ 图 像 标签 辅助 功能 属性 ”对 话 框 中 ,“ 蔡 换文 
本 ”文本 框 中 输入 “我 的 照片 ”， 单 击 “ 确 定 ” 按 钮 。 在 表格 中 出 现 了 个 人 照片 。 单 击 该 照片 ， 
在 “属性 ”面板 中 ， 设 置 宽度 为 120， 高 度 为 100， 如 图 10.38 所 示 ， 
[RE [ip 














1 图 像 , 小 。。 宽 D120 源 文 件 6) resme-photo.pne 全 已 普 撞 0) 我 as 片 关上 元 
了 ”高 0 i160 鱼 扩 吕 驴 已 坊间 国史 二 

本 中 重 直 边 距 o) 目标 四 国人 NOA 

NU DOVY # 下 iD) 原始 仿 已 入 几 攻 vv 直 =] 


图 10.38 “属性 ”面板 中 的 图 像 属性 
(6) 设置 第 一 列 宽 度 。 将 鼠标 指针 移 至 表格 中 第 一 列 上 方 ， 指 针 变 为 向 下 的 稍 头 ， 此 时 单 


B06 





击 ， 选 择 第 一 列 。 在 “属性 ”面板 中 ， 设 置 宽度 为 150。 








多 媒体 技术 实验 


| 

















(7) 单 击 照 片 所 在 的 单元 格 空白 处 ， 在 “属性 ”面板 中 ， 设 置 “ 水 平 ” 为 “居中 对 齐 ”， 

















“垂直 ”为 “顶端 ?， 照 片 即 可 位 于 单元 格 中 间 且 在 顶部 。 

(8) 插入 一 个 表格 作为 个 人 信息 简介 。 单 击 第 一 行 第 二 列 单元 格 ， 即 
选择 “ 择 入” 一“ 表格” 选项， 打开“ 表格 ”对 话 框 ， 设 
置 行 数 为 6， 列 数 为 4， 表 格 宽度 为 100%， 边 框 粗细 为 0 
像素 ， 单 元 格 边 距 为 4， 单 元 格 间距 为 0。 设 置 完成 后 单 
击 “确定 ”按钮 ， 插 入 如 图 10.39 所 示 的 表格 。 

(9) 选择 第 一 列 ， 修 改 列 宽 为 20%， 选 择 第 二 列 ， 修 
改 列 宽 为 30%， 同 样 修改 第 三 列 宽 度 为 20%， 第 四 列 宽 度 
为 30%。 在 该 表格 中 ， 和 输入 如 图 10.40 所 示 的 文字 。 

(10) 合并 单元 格 。 如 图 10.40 所 示 ， 选 中 联系 地 址 右 
侧 的 3 个 单元 格 ， 在 “属性 ”面板 中 ， 单 击 “ 单 元 格 ”3 ， 



































个 字 下 方 的 “合并 所 选单 元 格 ” 按 钮 回 ， 这 样 ， 选 定 的 3 不 这 相合 并 为 一 个 单元 格 。 同样 


的 操作 方法 ， 把 毕业 院 校 右 侧 的 3 个 单元 格 合并 为 二 个 和 元 


Dw m: 9- 4 














图 10.40 输入 文字 








10:3 插入 表格 作为 个 人 信息 简介 


NE 0 “ ER 
L TH 


照片 右 侧 的 单元 格 。 








(11) 修改 基本 信息 的 样式 。 如 图 10.41 所 示 ， 设 置 项 目 信息 的 字体 大 小 为 9pt， 颜 色 为 


并 666666; 设置 项 目 内 容 的 字体 为 粗 体 ， 颜 色 为 黑色 (默认 色 )。 


本 [XXX ee 要 
pn 


rm 村 7 
全 和 本科 村 站 证 律 
[7 TM CS nas 
wm 





10.41 修改 基本 信息 的 样式 


307 


一 多 若 你 找 林 及 真 应 用 (第 二 服 ) 


_ -一 (12) 输入 剩余 信息 。 在 剩余 的 单元 格 中 ， 输 入 以 下 信息 。 






































尖 兴 久久 天 学 

教育 背景 管理 信息 系统 学 士 学 位 加 权 平 均 分 : 86.7/100 2007 年 至 今 
会 计 学 第 二 专业 加 权 平均 分 : 86.4/100 2007.9 一 2010.7 
第 23 届 世 界 大 学 生 运 动 会 彩虹 志愿 团 优秀 工作 者 

i 校 优秀 学 生 干 部 

获奖 情况 校 三 好 学 生 
校 优秀 团员 
第 23 届 世 界 大 学 生 运 动 会 彩虹 志愿 团 
XX XX 大 学 总 指挥 

社会 活动 学 生 会 秘书 长 





班长 
团委 外 联 部 部 长 a 
2009 年 “全 国 计 算 机 水 平 考试 (二 级 ) CET-6 优秀 K 信 





IT 及 英语 技能 
(13) 创建 样式 。 如 














面板 中 ， 选 择 “CSS” 选 项 ， 在 “目标 规则 ”下 拉 列 表 
“编辑 规则 ”按钮 ， 打 开 如 图 10.43 所 示 的 “ SN 





刘 ， 对 话 框 。 





ym | 人 css 规则 广 
































六 和 he) 司 ~ : 辆 
国人 042 “编辑 规则 ”按钮 
新 建 C5s 规则 vy De 
De ,x 
先 css Mn TAA es 
A “ 
不 太 具 伟 重 具 体 
起 网 宗 义 - 
进 择 定义 规 RH 位 置 。 
Ca 
图 10.43 “新 建 CSS 规则 ”对 话 框 





10.42 所 示 ， 单 击 外 层 表格 中 的 第 全 第 二 列 单元 格 在 “属性 ” 
择 “ 新 CSS 规则 ” 


选项 ， 单 击 





选择 器 类 型 选择 “类 (可 应 用 于 任何 HTML 元 素 )” 选 项 ， 在 选择 器 名 称 中 输入 “right” 
作为 本 页 面 的 一 个 类 名 ， 单 击 “ 确 定 ” 按 钮 并 打开 “.right 的 CSS 规则 定义 ”对 话 框 。 在 “分 
类 ”中 选择 “ 方 框 ”选项 ， 在 右 侧 的 “ 方 框 ” 选 项 组 中 ， 修 改 Padding 的 设置 ， 取消 勾 选 “全 





部 相同 ” 复 选 框 ， 在 “Left” 中 ， 输 入 6,“Top” 中 输入 6， 如 图 10.44 所 示 。 单 击 


按钮 关闭 对 话 框 。 





“确定 ” 


同样 的 方式 ， 创 建 一 个 名 称 为 segment 的 CSS 类 ， 其 “分 类 ”中 选择 “边框 ?， 取 消 勾 选 


Bos 





多 媒体 技术 实验 


Style，Width、Color 中 的 “全 部 相同 ” 复 选 框 ， 将 Top 设置 为 solid，Width 为 thin、Color 为 
并 999。 并 应 用 于 外 围 表 格 中 的 最 后 4 行 中 的 单元 格 。 
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图 10.44 re 
注意 : 需要 应 用 于 单元 格 ， 而 不 是 行 。 
(14) 格式 化 信息 类 别 。 选 定 “ 教 育 背 景 ” i 插入 ”一 “布局 对 象 ”一 “Div 标签 ” 
选项 ， 打 开 “ 插 入 Div 标签 ”对 话 框 ， 单 Ss 规则 ” 按钮， 打开“ 新 建 CSS 规则 ”对 
话 框 ， 在 “选择 器 名 称 ” 输 入 a ee “确定 ”按钮 ， 打 开 “.segment title 的 


CSS 规则 定义 ”对 话 框 ， 其 中 需 设置 。 x 
类 型 Font-weight: boldi> 。、 Xz Wx 
背景 : Background-colof: “#FIFIF!1; 人 ol 
区 块 : Text-align; Re 


方 模 ， padding 的 洁 “全 部 相同 * 复 过 征 ， 六 届时 6px。 
设置 完成 后 、 可 以 看 到 如 图 1045 所 示 的 效果 。 


姓名 XXX 性 别 男 
民族 汉 到 当面 入 。 党 员 
学 历 本 科 专业 法 律 
联系 电 活 12345678 地 六 123456 
联系 地 址 
毕业 院 梳 

教育 背景 学 


管理 信息 系统 学士 学 位 加 权 平均 分 ，86.7/100 2007 年 至 今 
会 计 学 第 二 专业 加 权 平 均 分 ，86.4/100 2007.9 ~2010.7 


图 10.45 “教育 背景 ”设置 完成 后 的 效果 


(15) 创建 “获奖 情况 ”列表 。 选 中 “获奖 项 况 ” 右 侧 单元 格 内 的 4 项 获奖 项 目 ,选择 “ 格 
式 ” 一 “列表 ”一 “项 目 列表 ”选项 。 在 “属性 ”面板 中 ， 创 建新 的 CSS 目标 规则 ， 在 该 规 
则 中 ， 需 要 提高 行距 ， 并 设置 段 前 段 后 的 间距 。 选 择 “ 新 CSS 规则 ”， 单 击 “ 编 辑 规则 ” 按 
钮 ， 打开“ 新 建 CSS 规则 ”对 话 框 ， 在 “选择 器 类 型 ”的 下 拉 列 表 中 选择 “复合 内 容 (基于 选 
择 的 内 容 )” 选 项 ,在 选择 器 名 称 中 输入 “li.list”， 其 中 “li” 说 明 该 CSS 类 职能 应 用 于 列表 项 ， 
“.list” 是 自 定义 的 CSS 类 名 。 针 对 该 类 ， 进 行 如 下 设置 选项 。 
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一 多 若 你 找 林 及 站 应 用 (第 二 服 ) 


一 ”类 型 : line-height，135%; 


方 框 : Padding-top，0.5em; Padding-bottom，0.5em。 
对 4 个 获奖 项 应 用 该 CSS 类 ， 可 以 得 到 如 图 10.46 所 示 的 效果 。 











i 获奖 情况 。 .第 23 届 世界 大 学 生 运动 会 彩虹 志愿 团 优秀 工作 者 
| 。 校 优秀 学 生 干部 
| “ 校 三 好 学 生 
| 校 优秀 团员 
. 





图 10.46 “获奖 情况 ”列表 设置 后 的 效果 
(16) 重复 以 上 操作 ， 对 “社会 活动 “IT 及 英语 技能 ”等 项 目 进行 格式 化 ， 完 成 一 个 页 


面 的 制作 。 nz 
字 ! 人 
10.5.4 ”思考 与 实践 AN 
(1) HTML 的 基本 结构 是 怎样 的 ? 人 下 厂 
(2) 列表 有 几 种 形式 ? SN 


ON 
(3) 不 用 表格 ， 用 Div 是 否 可 以 ? "RS 
(4) 简 述 CSS 在 页 面 中 的 作用 。 NK \ 


A 


jie 视频 制 人 雹 } 





p MT 
10.6.1 实验 要 求 _: x 
~ > BY 
() re < 


(O) 掌握 片头; “片尾 制作 。 
G) 掌握 特效 制作 。 
(4) 掌握 过 渡 制 作 。 


10.6.2 ”实验 内 容 
把 Windows XP 随 操作 系统 带 的 示例 图 片 和 开源 电影 进行 合成 , 制作 一 部 有 特色 的 小 电影 。 
10.6.3 “实验 步骤 


(1) 准备 素材 。 首 先 从 http://www.bigbuckbunny.org/index.php/download 下 载 854X 480 像 
素 的 MSMP4 格式 的 电影 。 该 文件 大 小 约 165MB， 可 能 需要 一 定 的 时 间 。 

(2) 启动 Windows Movie Maker。 选择 “开始 ”一 “所 有 程序 ”一 “Windows Movie Maker” 
选项 。 

(3) 导入 素材 。 

@ 导入 照片 。 在 “电影 任务 ” 窗 格 中 的 任务 “捕获 视频 ”中 ， 单 击 “ 导 入 图 片 ”链接 ， 
打开 “导入 文件 ”对 话 框 ， 如 图 10.47 所 示 ， 定 位 到 “我 的 文档 ”中 的 “图 片 收藏 ”目录 ， 
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Ea 下 mw Milby pe” “Fee a - 
ET 


f 


图 10.47 “导入 文件 ” le- 


加 导入 配乐 。 在 “电影 任务 ” 窗 格 中 单 击 papi 链接 ， 
E 打开 “示例 音乐 ”文件 来， 选择 “New 


对 话 框 ， 定 位 到 “我 的 文档 ”中 的 “我 的 音 
Stories (Highway Blues)” 音 乐 ， 单 击 A 
图 导入 视频 。 在 “电影 任务 ” 






钮 。 
ij“ 导入 视频 ” 链接， 打开 “ 








击 “导入 ”按钮 。 


打开 “导入 文件 *” 


导入 文件 ”对 话 框 ， 


定位 到 步骤 (1) 中 下 载 hie, re 单 击 “ 导入” 按 外 时 部 入 视频 。 新 导入 的 视频 会 根据 视 
化 


频 中 的 标记 或 者 帧 内 容 发 生 明 显 
(4) 创建 片头 。 在 “电影 任务 ” 所 电影 ”中 ， 单 击 





会 创建 一 人 


“制作 片头 或 片尾 ” 








链接 ， 出 现 如 图 10.48 所 示 的 “ a ? ”区 域 ， 单 击 “ 在 上 


链接 ， 出 现 “ 个 片头 文本 ” 区 域 ， 该 区 域 
影 ” 在 第 二 个 中 输入 “作者 ” 他 选项 ”中 的 “更 改 文本 














电影 开头 添加 片头 。” 


文本 框 ， 在 第 一 个 文本 框 中 输入 “我 的 电 


字体 和 颜色 ”链接 ， 


在 “选择 片头 字体 和 颜色 ”区 域 中 将 字体 设置 为 “黑体 ”。 单 击 “ 其 他 选项 ”中 的 “更 改 片头 
动画 效果 ”链接 ， 在 “选择 片头 动画 ”区 域 中 ， 选 择 “ 片 头 ， 两 行 ” 下 的 “ 飞 入 ， 淡 化 ”的 











动画 效果 ， 然 后 单 击 “ 完 成 ， 为 电影 添加 片头 ”链接 。 
[ET 














图 10.48 “要 将 片头 添加 到 何 处 ? ”区 域 
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下 多 媒体 找 坟 及 其 应 用 (第 之 服 ) 


2 (5) 添加 素材 到 电影 中 。 在 主 窗口 中 ， 拖 放 Blue hills 和 Sunset 两 张 图 片 到 故事 面板 中 ， 
然后 把 下 载 电 影 中 的 几 个 剪辑 拖 放 到 故事 面板 中 ， 如 图 10.49 所 示 。 












































图 10.49 故事 曾 板 
(6) 修改 图 片 显示 时 间 。 单 击 “ 显 示 时 间 线 ”按钮 ， 切 换 到 时 间 线 窗口 。 将 鼠标 指针 定位 
于 Sunset 和 Blue hills 中 间 线 上 ， 如 图 10.50- 所 示 ， 鼠 标 指针 变 为 拖 放 状态 ， 单 击 拖 放 Sunset 
的 持续 时 间 为 3s, 同样 修改 Blue hills 的 持续 时 间 为 3s。 | 显示 情节 提要 ”按钮 , 返回 “ 情 
节 提 要 ”界面 。 





10.50 ”鼠标 光标 定位 


(7) 添加 视频 过 渡 。 在 “电影 任务 ” 窗 格 中 的 任务 “编辑 电影 ”中 ， 单 击 “ 查 看 视频 过 渡 ” 
链接 。 视 频 过 渡 窗 口中 显示 了 可 用 的 所 有 过 渡 效 果 。 将 “多 圆 ”效果 ， 拖 放 到 第 一 个 过 渡 容 
器 中 : 将 粉碎 ， 中 间 ” 效 果 ， 拖 放 到 第 二 个 过 渡 容 器 中 ;将 “眼睛 ”效果 ， 拖 放 到 第 三 
过 渡 容 器 中 ， 得 到 如 图 10.51 所 示 的 界面 


吴强 a 


图 10.51 拖 放 后 的 效果 


(8) 添加 视频 效果 。 单 击 “ 电 影 任务 ” 窗 格 中 的 “编辑 电影 ”下 的 “查看 视频 效果 ”链接 。 
视频 效果 窗口 中 列 出 了 所 有 可 用 效果 。 找 到 “缓慢 放大 ”效果 ， 拖 放 到 Sunset 上 ; 找到 “组 
慢 缩 小 ”效果 ， 拖 放 到 Blue hills 上 。 
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(9) 插入 音乐 。 首 先 单 击 “ 显 示 时 间 线 ” 按 钮 ， 进 入 时 间 线 状态 。 把 “收藏 ”窗口 中 的 
New Stories(Highway Blues) 音 乐 拖 放 到 音频 /音乐 轨道 中 。 如 图 10.52 所 示 ， 缩 小 显示 ， 让 音 
乐 能 够 显示 完全 ， 然 后 拖 放 音乐 末端 至 视频 末端 ， 从 而 音 视 频 同步 结束 。 











图 10.52 插入 音乐 


(10) 保存 电影 。 在 “电影 任务 ” 窗 格 中 ， 在 “电影 任务 ” 窗 格 中 的 任务 “完成 电影 ”中 ， 
单 击 “ 保 存 到 我 的 计算 机 ”链接 ， 打 开 “ 保 存 电影 向 导 ” 人 所 保存 的 电影 输入 文件 
名 ， 并 选择 保存 电影 的 位 置 ， 单 击 “ 下 一 步 ”按钮 ， 点 选 机 上 播放 的 最 佳 质量 
(MD( 推 荐 )” 单 选 按钮 ， 单 击 “ 下 一 步 ”按钮 ， 系 统 会 提示 电影 ， 根 据 电 影 的 长 度 不 
同 ， 需 要 等 待 的 时 间 也 不 同 。 待 向 导 进 入 最 后 一 步 , 单 10.53 所 示 的 “完成 ”按钮 即 完 
成 保存 。 也 可 以 选中 单 击 “ 完 成 ”后 播放 电影 ， mA 洁 束 后 自动 播放 刚才 制作 完毕 的 
电影 。 

















图 10.53 单 击 “完成 ”按钮 


10.6.4 ”思考 与 实践 


(1) 为 前 面 制作 的 影片 添加 片尾 ， 从 下 至 上 显示 字幕 。 

(2) 有 条 件 的 利用 网 络 摄像 头 为 自己 录制 一 份 自我 推荐 视频 , 并 在 片头 加 入 自己 的 姓名 及 
联系 方式 等 信息 ， 片 尾 加 入 感谢 的 字幕 。 

(3) 若 有 兴趣 研究 更 高 级 别 的 视频 剪辑 工具 ， 可 以 学 习 Adobe Premiere、Final Cut Pro、 
Sony Vegas 等 非 线 性 编辑 软件 。 
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23 17-301-12177-1| 现 代 通 信 系统 | 60 |7.301-12380-5| 电 子 测量 与 传 感 技术 杨 雷 | 35 
24 17-301-12340-9| 模 拟 电 子 技术 | 61 |7-301-14461-9| 训 电压 技术 马 永 翔 | 28 
25 | aol-l3lz1.3| 卫 所 电子 技术 实验 教程 。 | 谭 海 嚼 | 24 62 | aoi-la7z.s 攻 名医 潼 至 所 分 于 及 天 尚志 网 | 2 
ATLAB 实现 
26 |7-301-11502-2| 移 动 通信 郭 俊 强 | 22 | 63 |7-301-14460-2| 电 力 系 统 分 析 曹 _ 娜 | 35 
27 |7-301-11504-6 梅 开 乡 | 30 ‖ 64 |7-301-14459-6|DSP 技术 与 应 用 基础 俞 一 彪 | 34 
28_|7-301-18860-G 吴 亚 丽 | 28 | 65 |7-301-14994-2 际 合 布线 系统 基础 教程 吴 达 金 | 24 
29 |7-5038-4407-2 祝 诗 平 | 30 | 66 |7-301-15168-6| 信 号 处 理 MATLAB 实验 教 利 李 _ 杰 | 20 
30 |7-5038-4413-3| 单 片 机 原理 及 应 用 刘 刚 | 24 | 67 |7-301-15440-3| 电 工 电 子 魏 伟 | 26 
31 |7-5038-4409-6| 电 机 与 拖 动 杨 天 明 | 27 | 68 |7-301-15445-8| 愉 测 与 控制 实验 教程 魏 _ 伟 | 24 
32 |7-5038-4411-9| 电 力 电子 技术 樊 立 萍 | 25 | 69 |7-301-04595-4| 电 路 与 模拟 电子 技术 张 绪 光 | 35 
33 |7-5038-4399-0| 电 力 市 场 原 理 与 实践 多 斌 | 24 | 70 Ta0rlstssa| 后 几 玫 人 5 印 德 润 | 70 
34 |7-5038-4405-8| 电 力 系统 继 电 保护 马 永 翔 | 27 | 71 17-301-15786-2| 通 信 网 的 信 令 系统 
35 |7-5038-4397-6| 电 力 系统 自动 化 孟 祥 忠 | 25 ‖ 72 17-301-16493-8| 发 电厂 变 电 所 电气 部 分 
36 |7-5038-4404-1| 电 气 控制 技术 韩 顺 杰 | 22 ‖ 73 |7-301-16076-3 司 字 信 号 处 理 
37 |7-5038-4403-4| 电 器 与 PLC 控制 技术 陈 志 新 | 38 ‖ 74 17-301-16931-5| 微 机 原理 及 接口 技术 














序号 | 标准 书号 书 名 主 出 定 价 | 序号 | 标准 书号 书 名 庄 编写 人 
子 信息 类 专业 

75 |7-301-16932-2| 数 字 电 子 技术 刘 金 华 | 30 ‖ 100 |7-301-19452-2 人 ei 李 明 明 | 42 
实验 教程 
76 |7-301-16933-9|E 丁 红 | 32 | 101 17-301-16914-8| 物 理光 学 理论 与 应 用 宋 贵 才 | 32 
77 |7-301-17540-8| 单 片 机 原理 及 应 用 教程 。_| 周 广 兴 | 40 | 102 |7-301-16598-0 际 合 布线 系统 管理 教程 吴 达 金 | 39 


微机 原理 及 接口 技术 实验 揽 




























































78 |7-301-17614-6 时 书 李 干 林 | 22 ‖ 103 |7-301-20394-1 | 网 联网 基础 与 应 用 李 苦 田 | 44 
79 |7-301-12379-9| 28 | 104 |7-301-20339-2| 数 字 图 像 处 理 李 云 红 | 36 
80 |7-301-17382-4| 离 25 | 105 |7-301-20340-8| 信 号 与 系统 李 云 红 | 29 
81 |7-301-17677-] 32 |‖ 106 |7-301-20505-1| 电 路 分 析 基 础 吴 舒 秤 | 38 
82 |7-301-17683-2| 光 纤 通信 李 丽 君 | 26 e107 |7-301-20506-8 耽 码 调制 技术 黄平 | 26 
83 |7-301-17700-6| 异 拟 电子 技术 张 绪 光 | 36 ‖ 1og |7-301-20763-5 网 络 工程 与 管理 谢 慧 | 39 
RM 嵌入 式 系统 基础 与 刑 - 。 单片机 原理 与 接口 技术 实 
84 |7-301-17318-3|,, ,0 、 ”|T 文 帮 36 | 109 |7-301-2084s-8 " 徐 懂 理 | 26 
发 教程 与 课 
85 17-301-17797-6|PLC 原理 及 应 用 110 | 301-20725-3 | 异 拟 电子 线路 宋 树 祥 | 38 
Es 单 其 机 原理 与 应 用 及 其 实 骤 ，，、 
86 |7-301-17986-4| 数 字 信号 Sy 到 邵 发 森 | 44 
thcad 在 信号 与 系统 中 的 
87 |7-301-18131-7| 集 散 控制 系统 和 人 郭 仁 春 | 30 
88 |7-301-18285-7| 电 子 线路 CAD 王 土 军 | 34 
89 |7-301-16739-7IMATLAB 基础 及 应 用 王 玉 华 | 49 


90 |7-301-18352-6| 






制 电机 与 特种 电机 及 其 
| 控制 系统 
92 |7-301-18493-6| 电 工 技术 A 6 
93 |7-301-18496-7 上 现代 电子 系统 设计 教程 
94 |7.301-18672-5| 太 阳 能 电池 原理 与 成 用 
95 |7-301-18314-4| 通 信和 电子 线路 及 仿真 设计 


:9 IMATLAB 基础 与 应 用 教程 “| 王 月 明 | 32 





91 |7-301-18260-4| 


息 论 与 编码 本 本 四 电路 与 模拟 电子 技术 实验 括 | 富 | 26 


| 7 -301s21235;6 区 成 电路 版 图 设计 学 斌 
| 8 |7-391-31304-9 油 字 电子 技术 陈 长 海 | 49 
| ti9d-301-21366-7 | 电力 系统 继 电 保护 (第 2 版 ) 加 永 翔 | 42 
301-21450-3 虞 拟 电子 与 数字 逻 得 区 春明 | 39 







































96 |7-301-19175-0| 音 片 机 原 刘 与 接口 技术 -301-21439-8 县 联网 概论 下 金 甫 | 和 2 
97 |7-301-19320-4| 移 动 通 信 外 7-301-21849-5 | 油 波 技术 基础 及 其 应 用 泽 民 | 49 
98 |-301-19447-8 | 电气 信息 与 通信 工程 专业 肉桂 芝 | 36 
其 入 式 系统 设计 及 应 用 
原 如 电子 课件 、 电 子 教材 、 习 题 答案 等 可 以 登录 www.pup6.com 下 载 或 在 色 站 
“知识 网 (www.pup6.com) 有 海量 的 相关 教学 资源 和 电子 教材 供 阅读 及 下 载 (包括 北京 大 学 出 版 社 第 





六 事业 部 的 相关 资源 )， 同 时 欢迎 您 将 教学 课件 、 视 频 、 教 案 、 素 材 、 习 题 、 试 卷 、 辅 导 材料 、 课 改 成 果 、 
设计 作品 、 论 文 等 教学 资源 上 传 到 pup6.com， 与 全 国 高 校 师 生 分 享 您 的 教学 成 就 与 经 验 ， 并 可 自由 设 定 
价格 ， 知 识 也 能 创造 财富 。 具 体 情况 请 登录 网 站 查询 。 

如 您 需要 免费 纸 质 样 书 用 于 教学 , 欢迎 登陆 第 六 事业 部 门户 网 (www:pup6.cn) 填 表 申请 ， 并 欢迎 在 线 登记 选 
题 以 到 北京 大 学 出 版 社 来 出 版 您 的 大 作 ， 也 可 下 载 相关 表格 填写 后 发 到 我 们 的 邮箱 ,我 们 将 及 时 与 您 取得 联系 
并 做 好 全 方位 的 服务 。 

扑 六 知识 网 将 打造 成 全 国 最 大 的 教育 资源 共享 平台 ， 欢 迎 您 的 加 入 一 一 让 知识 有 价值 ， 让 教学 无 界限 ， 让 
学 习 更 轻松 。 

联系 方式 : 010-62750667，pup6_czq@163.com，szheng_pup6@163.com，linzhangbo@126.com， 欢 迎 
来 电 来 信 咨 询 。 





